Πίνακας περιεχομένων:
Ορισμός - Τι σημαίνει Apache Avro;
Το Apache Avro είναι ένα πλαίσιο κλήσης σειριακών δεδομένων και απομακρυσμένης διαδικασίας που αναπτύσσεται στο πλαίσιο του έργου Apache Hadoop όπου παρέχει τόσο μια μορφή serialization για να αποκτήσει σταθερά δεδομένα όσο και ένα καλώδιο για την παροχή επικοινωνίας μεταξύ κόμβων Hadoop καθώς και σύνδεση προγραμμάτων-πελατών με το Hadoop Υπηρεσίες.
Η Avro χρησιμοποιεί τη μορφή JSON για τον καθορισμό πρωτοκόλλων και τύπων δεδομένων, καθώς και την σειριοποίηση των δεδομένων σε μια συμπαγή δυαδική μορφή.
Η Techopedia εξηγεί την Apache Avro
Το Apache Avro είναι ένα μεγάλο πλαίσιο serialization δεδομένων που παράγει δεδομένα σε μια συμπαγή δυαδική μορφή που δεν απαιτεί δημιουργία κώδικα ή αντικείμενα μεσολάβησης.
Χρησιμοποιείται ως συστατικό serialization δεδομένων για το Apache Hadoop. Το Avro εργάζεται για την έννοια των σχημάτων. Όταν διαβάζονται δεδομένα Avro, υπάρχει πάντα το σχήμα που χρησιμοποιήθηκε κατά τη σύνταξη αυτών των συγκεκριμένων δεδομένων.
Αυτό επιτρέπει σε κάθε σύνολο δεδομένων χωρίς γενικά έξοδα ανά αξία, γεγονός που καθιστά την σειριοποίηση τόσο γρήγορη όσο και σχετικά μικρή σε μέγεθος. Και δεδομένου ότι τα δεδομένα και το σχήμα τους είναι πλήρως αυτοπεριγραφικά, αυτό το καθιστά εύκολο στη χρήση με δυναμικές γλώσσες δέσμης ενεργειών.
Όταν τα δεδομένα Avro αποθηκεύονται σε ένα συγκεκριμένο αρχείο, το σχήμα αποθηκεύεται επίσης μαζί τους για να υποστούν επεξεργασία αργότερα από άλλο πρόγραμμα. Επομένως, εάν ένα πρόγραμμα που διαβάζει τα δεδομένα αναμένει ένα άλλο σχήμα, τότε αυτό μπορεί εύκολα να επιλυθεί καθώς υπάρχουν και τα δύο σχήματα.
Η Avro παρέχει:
Μια συμπαγής και γρήγορη μορφή δυαδικών δεδομένων
Πλούσιες δομές δεδομένων
Ένα αρχείο δοχείου για την αποθήκευση επίμονων δεδομένων
Απομακρυσμένη κλήση διαδικασίας (RPC)
Ενσωμάτωση με δυναμικές γλώσσες
Η δημιουργία κώδικα δεν αποτελεί προϋπόθεση για την ανάγνωση ή την εγγραφή αρχείων δεδομένων ή τη χρήση ή την εφαρμογή πρωτοκόλλων RPC.
