Πίνακας περιεχομένων:
Ορισμός - Τι σημαίνει Apache Lucene;
Το Apache Lucene είναι ένα έργο ανοιχτού κώδικα για μια υψηλής απόδοσης και πλήρους μηχανής βιβλιοθήκη μηχανών αναζήτησης κείμενο που είναι γραμμένο εξ ολοκλήρου χρησιμοποιώντας Java.
Είναι ικανή για αναζήτηση πλήρους κειμένου μέσα σε έγγραφα, ώστε να είναι μια τεχνολογία που είναι κατάλληλη για οποιαδήποτε εφαρμογή που απαιτεί αυτό το χαρακτηριστικό, ειδικά εάν είναι cross-platform.
Κατασκευάστηκε για πρώτη φορά από τον Doug Cutting το 1999 και έγινε επίσημα μέρος της οικογένειας έργων Java open source του Τζακάρτα του Ιδρύματος Apache το Σεπτέμβριο του 2001. Αναβαθμίστηκε σε έργο Apache κορυφαίου επιπέδου το Φεβρουάριο του 2005.
Η Techopedia εξηγεί την Apache Lucene
Το Apache Lucene είναι μια μηχανή αναζήτησης υψηλής απόδοσης με την έννοια του "εγγράφου που περιέχει πεδία κειμένου" στην κεντρική λογική αρχιτεκτονική του. Αυτό προσφέρει μεγάλη ευελιξία και επιτρέπει στο Lucene API να γίνει ανεξάρτητο από οποιαδήποτε μορφή αρχείου.
Οποιοδήποτε κείμενο από μορφές όπως MS Word, HTML, XML, PDF και OpenDocument μπορεί να ευρετηριωθεί όσο μπορούν να εξαχθούν οι πληροφορίες κειμένου, πράγμα που σημαίνει ότι δεν μπορεί να κάνει τίποτα με εικόνες.
Το Lucene είναι κατάλληλο για οποιαδήποτε εφαρμογή που απαιτεί δυνατότητα ευρετηρίασης και αναζήτησης πλήρους κειμένου, αλλά αναγνωρίζεται ευρέως ως ένα μεγάλο βοηθητικό πρόγραμμα για την υλοποίηση μηχανών αναζήτησης στο Διαδίκτυο και για τοπική αναζήτηση σε ένα site.
Τα χαρακτηριστικά γνωρίσματα περιλαμβάνουν:
- Ευέλικτη και υψηλής απόδοσης ευρετηρίαση - μπορεί να επεξεργαστεί πάνω από 150 Gb ανά ώρα σε σύγχρονο υλικό και απαιτεί μόνο 1 Mb ανά σωρό από απαιτήσεις μνήμης.
- Ισχυροί, ακριβείς και αποτελεσματικοί αλγόριθμοι αναζήτησης - προσφέρει πολλούς τύπους ισχυρών ερωτημάτων όπως φράση, μπαλαντέρ, εγγύτητα και ερωτήματα εύρους. Επίσης, έχει διεξαγάγει έρευνα και ταξινόμηση από οποιοδήποτε πεδίο.
- Cross Platform - καθαρή εφαρμογή Java και επίσης διαθέσιμη σε άλλες γλώσσες προγραμματισμού.
