Ερ:
Γιατί οι διαχειριστές πρέπει να προστατεύουν από την αποφυγή της βάσης δεδομένων;
ΕΝΑ:Οι διαχειριστές βάσεων δεδομένων και άλλοι επαγγελματίες στον τομέα των τεχνολογιών πληροφορικής θα πρέπει να προφυλάσσονται από την "εφεδρεία της βάσης δεδομένων" ή την "πλεοναστικότητα δεδομένων" εξαιτίας όλων των αρνητικών επιπτώσεων που μπορεί να έχει το πλεόνασμα σε ένα σύστημα βάσης δεδομένων ή περιβάλλον. Οπουδήποτε ένα συγκεκριμένο κομμάτι δεδομένων αντιγράφεται είτε σε δύο πεδία μιας βάσης δεδομένων είτε σε δύο διαφορετικά περιβάλλοντα βάσεων δεδομένων, μπορεί να έχει συνέπειες για την ανάκτηση δεδομένων.
Ένας από τους πρώτους λόγους για την αποφυγή της πλεονασμού δεδομένων είναι ότι μπορεί να είναι άχρηστο ή υπερβολικό.
Είναι σημαντικό να επισημανθεί ότι ορισμένοι τύποι πλεονασμάτων δεδομένων σχεδιάζονται, προκειμένου να διαφυλαχθούν και να υποστηριχθούν δεδομένα. Ωστόσο, άλλοι προκύπτουν από την κακή ή αναποτελεσματική κωδικοποίηση ή την έλλειψη προσοχής στις βέλτιστες πρακτικές. Σε πολλές περιπτώσεις, μεγάλες ποσότητες πλεονασμάτων δεδομένων προκαλούν την ταχεία αύξηση της βάσης δεδομένων πέρα από ένα λογικό μέγεθος. Με αυτό το πνεύμα, πολλές προσπάθειες για την καταπολέμηση της απόλυσης δεδομένων γίνονται για εξοικονόμηση χώρου σε μια βάση δεδομένων, και κατά συνέπεια, για μείωση του κόστους και της προσπάθειας συντήρησης. Ωστόσο, αυτό πρέπει να γίνει με προσοχή στην πρακτικότητα - οι μηχανικοί μπορούν να ασκήσουν κάτι που ονομάζεται deduplication δεδομένων, αλλά πρέπει να γίνει με τρόπο που να είναι αποτελεσματικός.
Για παράδειγμα, οι διαχειριστές βάσεων δεδομένων μπορούν να διερευνήσουν κάτι σαν να απομακρύνουν μια συμβολοσειρά από ένα επαναλαμβανόμενο πεδίο, όπως ένας κοινός πελάτης ή το όνομα της εταιρείας, και να την αντικαταστήσουν με μια απλή μεταβλητή αναφορά όπου η συμβολοσειρά κρατείται κάπου αλλού. Αυτό μπορεί να εξοικονομήσει χώρο σε μια βάση δεδομένων - αλλά μπορεί επίσης να απαιτήσει περισσότερη δραστηριότητα διακομιστή για να εκτελέσει ένα δεδομένο ερώτημα, οπότε ίσως να μην είναι τόσο αποτελεσματικό όσο φαίνεται.
Ένας άλλος μεγάλος λόγος για να deduplicate τα δεδομένα ή την αποφυγή πλεονασμού δεδομένων είναι λόγω της σύγχυσης που μπορεί να προκύψει. Τα πλεονάζοντα δεδομένα σε μια βάση δεδομένων μπορούν να προκαλέσουν διάφορους τύπους ανωμαλιών. Ένα από αυτά ονομάζεται ανωμαλία ενημέρωσης - παρουσιάζονται ανωμαλίες ενημέρωσης όταν μια εγγραφή εισάγεται εκ νέου με ενημερωμένες πληροφορίες, αλλά η ενημέρωση δεν επαναφέρει την αρχική εγγραφή. Σε μια τέτοια περίπτωση, μπορεί να υπάρχουν τρεις διαφορετικές εγγραφές για έναν συγκεκριμένο υπάλληλο της εταιρείας, με τρεις διαφορετικούς τίτλους εργασίας και τρεις διαφορετικές διευθύνσεις, επειδή οι πληροφορίες του ατόμου δεν ενημερώθηκαν σε ολόκληρη τη βάση δεδομένων, αλλά μόνο στο τελευταίο αρχείο που καταχωρήθηκε τελευταία.
Όπως πρότειναν οι εμπειρογνώμονες, οι διαχειριστές βάσεων δεδομένων μπορούν να αποφύγουν τη δημιουργία πλεονασμάτων δεδομένων από το σχεδιασμό. Μπορούν επίσης να συμμετάσχουν σε πρακτικές εξομάλυνσης δεδομένων που μπορούν να διορθώσουν τις ανωμαλίες ενημέρωσης και άλλα είδη ανωμαλιών με την τυποποίηση των τρόπων με τους οποίους διατηρούνται τα αρχεία των τραπεζών βάσης δεδομένων. Οι διαχειριστές βάσεων δεδομένων μπορούν επίσης να συνεχίσουν τις προσπάθειες deduplication δεδομένων που καθαρίζουν και τυποποιούν δεδομένα με άλλους τρόπους. Όλα αυτά εξυπηρετούν το σκοπό της δημιουργίας πιο καθαρών πινάκων βάσης δεδομένων, καθιστώντας τα αρχεία βάσεων δεδομένων πιο συνεπή και αποτρέποντας όλους τους πονοκεφάλους και τα σύνθετα προβλήματα που συνδέονται με την απρογραμμάτιστη πλεονασμό δεδομένων.