Πίνακας περιεχομένων:
Ορισμός - Τι σημαίνει JobTracker;
Το JobTracker είναι ένας δαίμονας που τρέχει στον μηχανισμό MapReduce του Apache Hadoop. Το JobTracker είναι μια βασική υπηρεσία που εκμεταλλεύεται όλες τις εργασίες MapReduce στους διάφορους κόμβους του συμπλέγματος, ιδανικά σε εκείνους τους κόμβους που περιέχουν ήδη τα δεδομένα ή τουλάχιστον βρίσκονται στο ίδιο rack με τους κόμβους που περιέχουν τα δεδομένα.
Η Techopedia εξηγεί το JobTracker
Το JobTracker είναι η υπηρεσία εντός της Hadoop που είναι υπεύθυνη για τη λήψη αιτημάτων πελατών. Τους αναθέτει στους TaskTrackers στα DataNodes όπου τα απαιτούμενα δεδομένα είναι τοπικά παρόντα. Εάν αυτό δεν είναι δυνατό, το JobTracker προσπαθεί να αναθέσει τις εργασίες στους TaskTrackers μέσα στο ίδιο rack όπου υπάρχουν τα δεδομένα τοπικά. Εάν για κάποιο λόγο αποτύχει επίσης, το JobTracker αναθέτει την εργασία σε ένα TaskTracker όπου υπάρχει ένα αντίγραφο των δεδομένων. Στο Hadoop, τα μπλοκ δεδομένων αναπαράγονται σε όλα τα DataNodes για να εξασφαλιστεί η πλεοναστικότητα, έτσι ώστε εάν ένας κόμβος στο σύμπλεγμα αποτύχει, η εργασία δεν αποτυγχάνει επίσης.
Διαδικασία JobTracker:
- Τα αιτήματα εργασίας από εφαρμογές πελάτη λαμβάνονται από το JobTracker,
- Το JobTracker συμβουλεύει το ΌνομαNode για να προσδιορίσει τη θέση των απαιτούμενων δεδομένων.
- Το JobTracker εντοπίζει κόμβους TaskTracker που περιέχουν τα δεδομένα ή τουλάχιστον βρίσκονται κοντά στα δεδομένα.
- Η εργασία υποβάλλεται στο επιλεγμένο TaskTracker.
- Το TaskTracker εκτελεί τις εργασίες του ενώ παρακολουθείται στενά από το JobTracker. Εάν η εργασία αποτύχει, το JobTracker απλώς επαναλάβει την εργασία σε άλλο TaskTracker. Ωστόσο, το ίδιο το JobTracker είναι ένα μόνο σημείο αποτυχίας, που σημαίνει ότι αν αποτύχει ολόκληρο το σύστημα πέσει κάτω.
- Το JobTracker ενημερώνει την κατάστασή του όταν ολοκληρωθεί η εργασία.
- Ο αιτών-πελάτης μπορεί τώρα να διερευνήσει πληροφορίες από το JobTracker.
