Πίνακας περιεχομένων:
Ορισμός - Τι σημαίνει Data Lake;
Μια λίμνη δεδομένων είναι ένας μαζικός, εύκολα προσβάσιμος, κεντρικός χώρος αποθήκευσης μεγάλων όγκων δομημένων και αδόμητων δεδομένων.Η Techopedia εξηγεί τη Data Lake
Η αρχιτεκτονική λίμνης δεδομένων είναι μια προσέγγιση αποθήκευσης-οτιδήποτε για μεγάλα δεδομένα. Τα δεδομένα δεν ταξινομούνται όταν αποθηκεύονται στην αποθήκη, καθώς η αξία των δεδομένων δεν είναι σαφής στην αρχή. Ως αποτέλεσμα, η προετοιμασία των δεδομένων εξαλείφεται. Επομένως, μια λίμνη δεδομένων είναι λιγότερο δομημένη σε σύγκριση με μια συμβατική αποθήκη δεδομένων. Όταν τα δεδομένα έχουν πρόσβαση, μόνο τότε ταξινομούνται, οργανώνονται ή αναλύονται.
Hadoop, ένα πλαίσιο ανοιχτού κώδικα για την επεξεργασία και την ανάλυση μεγάλων δεδομένων, μπορεί να χρησιμοποιηθεί για να κοσκινίσει τα δεδομένα στο αποθετήριο.
