Ώρες Διδασκαλίας: Πέμπτη 14:00-17:00
Ύλη Μαθήματος
Το μάθημα καλύπτει τις βασικές αρχές, αλγόριθμους και εφαρμογές της ανάκτησης πληροφορίας από συλλογές κειμένων και στις μηχανές αναζήτησης.
Εργασία
Θα δοθεί μια εργασία (project) που θα αφορά την υλοποίηση ενός συστήματος ανάκτησης πληροφορίας με χρήση
lucene
Η εργασία θα γίνει σε ομάδες 2 ατόμων.
Προκαταρκτικό Χρονοδιάγραμμα
7/4/2016 | Αρχική εκφώνηση εργασίας | εδώ |
14/4/2016 | Ορισμός ομάδων | Ομάδες |
21/4/2016 | Παράδοση αρχικού σχεδιασμού | Οδηγίες |
26/5/2016 | Παράδοση κώδικα και αναφοράς | Οδηγίες |
27/5/2016 | Εξέταση εργασίας |
Εισαγωγή. Ανάκτηση Boole (κεφ 1) | Διαφάνειες pptx pdf | Προ-επεξεργασία και δημιουργία λεξιλογίου. Ευρετήρια καταχωρήσεων. Ερωτήματα φράσεων και γειτονικότητας. (κεφ 2) | Διαφάνειες pptx pdf |
Δομές Αναζήτησης για Λεξικά. Ανεκτική ανάκτηση: ερωτήσεις με *, ορθογραφικά λάθη, απόσταση όρων, φωνητική διόρθωση. (κεφ 3) | Διαφάνειες pptx pdf |
Κατασκευή Ευρετηρίου. Στατιστικά Συλλογής. Συμπίεση. (κεφ 4-5) | Διαφάνειες pptx pdf |
Βαθμολόγηση και διάταξη εγγράφων. Στάθμιση όρων. Το μοντέλο διανυσματικού χώρου.Πλήρες σύστημα αναζήτησης. Περιλήψεις αποτελεσμάτων. (κεφ 6-7) | Διαφάνειες pptx pdf |
Αξιολόγηση στην Ανάκτηση Πληροφορίας. (κεφ. 8) | Διαφάνειες pptx pdf |
Βασικές Αρχές Ανάκτησης στον Ιστό. Ανάλυση Συνδέσμων. Διαφημίσεις. (κεφ 19-21) | Διαφάνειες pptx pdf |
Άλλα Θέματα στην Ανάκτηση στον Ιστό. Χρήστες. Σταχυολόγηση. Μέγεθος ιστού. (κεφ 19-21) | Διαφάνειες pptx pdf |
Lucene. | Διαφάνειες pptx pdf |
Διαφάνειες Προηγούμενου Έτους εδώ