Οδηγίες για Lucene

Εγκατάσταση

Τη βιβλιοθήκη Lucene (γραμμένη σε Java) μπορείτε να την κατεβάσετε από αυτό το site. Είναι διαθέσιμη και ως .jar αρχείο αλλά και ως source code. Αυτό που θα σας χρειαστεί είναι το .jar αλλά πάντα είναι χρήσιμο να έχετε και τον πηγαίο κώδικα ώστε να βλέπετε τι κάνει κάθε συνάρτηση.

Θυμηθείτε να τροποποιήσετε κατάλληλα το CLASSPATH του συστήματός σας ώστε να περιέχει και το .jar αρχείο της Lucene.

Παράδειγμα δημιουργίας ευρετηρίου

Σε αυτό το .zip υπάρχουν μερικά αρχεία από τα demo της Lucene (ελαφρώς τροποποιημένα όσον αφορά τα packages στα οποία ανήκουν) καθώς και το .jar αρχείο. Είναι μία πολύ καλή αρχή για να φτιάξετε τον δικό σας κώδικα για ευρετηριοποίηση αρχείων κειμένου.

Το πρόγραμμα FileDocument.java ορίζει το είδος των "Documents" της Lucene. Σύμφωνα με αυτό το πρόγραμμα, για κάθε αρχείο στη συνέχεια κρατάμε στο ευρετήριο το όνομά του, την ημερομηνία τελευταίας τρποποίησης και τα περιεχόμενά του.

Το πρόγραμμα IndexFiles.java παίρνει ως είσοδο ένα directory και δημιουργεί ένα ευρετήριο με όλα τα αρχεία του directory αυτού.

Έχοντας ήδη δημιουργήσει ένα ευρετήριο, μπορείτε να χρησιμοποιήσετε το πρόγραμμα SearchFiles.java για να κάνετε ερωτήσεις σε αυτό.

Links

Ένα πολύ ευκολοδιάβαστο και κατατοπιστικό site με τα βασικά για τη lucene είναι το: το http://www.lucenetutorial.com