Ερ:
Ποια είναι τα βασικά ζητήματα που πρέπει να εξεταστούν σε μια μεγάλη στρατηγική αποθήκευσης δεδομένων;
ΕΝΑ:Ένα από τα μεγαλύτερα ζητήματα που αγνοείται για τη μεγάλη αποθήκευση δεδομένων είναι η προσβασιμότητα για τις ομάδες που την χρειάζονται. Τα δεδομένα φυλάσσονται τακτικά χωρίς τεκμηρίωση, σε χώρους όπου είναι δύσκολο να υπάρξει πρόσβαση ή όπου οι σχετικές ομάδες δεν γνωρίζουν το γεγονός ότι υπάρχει καθόλου. Τελικά, η αποθήκευση μεγάλων δεδομένων θα πρέπει να ακολουθήσει μια ανοιχτή πρώτη στρατηγική, όπου οι ομάδες ενημερώνονται για την ύπαρξή τους, τα δεδομένα που συνίστανται και τον τρόπο πρόσβασης, έτσι ώστε οι ομάδες να μπορούν να το χρησιμοποιήσουν στο λογισμικό αν το χρειάζονται.
Ένα άλλο κρίσιμο ζήτημα που βρίσκω είναι η ποιότητα των δεδομένων που αποθηκεύονται. Τα δεδομένα θα πρέπει να αποθηκεύονται στη μορφή της υψηλότερης ποιότητας που μπορεί να υπάρχει στην τελική θέση αποθήκευσης. Η αποθήκευση δεδομένων χαμηλής ποιότητας σε μια λίμνη δεδομένων είναι συνήθως ωραία, αλλά καθώς συνεχίζεται προς τα κάτω ο αγωγός δεδομένων, κάθε στάδιο πρέπει να αυξάνει την ποιότητα των δεδομένων, έτσι ώστε να αποθηκεύεται στη μορφή της υψηλότερης ποιότητας σε ένα σύστημα όπως μια αποθήκη δεδομένων ή μια βάση δεδομένων αναλυτικών στοιχείων. Αυτό θα αυξήσει την ποιότητα των συστημάτων που καταναλώνουν τον χώρο ανάπαυσης των δεδομένων.