MYE003: Ανάκτηση Πληροφορίας
Εαρινό Εξάμηνο 2017-2018

Διδάσκουσα: Ευαγγελία Πιτουρά

Ώρες Διδασκαλίας: Τετάρτη 12:00-14:00
Ώρες Διδασκαλίας: Πέμπτη 12:00-13:00

Ανακοινώσεις
Βιβλία


Ύλη Μαθήματος

Το μάθημα καλύπτει τις βασικές αρχές, αλγόριθμους και εφαρμογές για την ανάκτησης πληροφορίας από συλλογές κειμένων, κοινωνικά δίκτυα και τον ιστό.


Εργασία

Θα δοθεί μια εργασία (project) που θα αφορά την υλοποίηση ενός συστήματος ανάκτησης πληροφορίας με χρήση lucene. Αυτή τη χρονιά, η εργασία θα αφορά δεδομένα που αφορούν κριτικές χρηστών.

Η εργασία θα γίνει σε ομάδες των 2 ατόμων.

Προκαταρκτικό Χρονοδιάγραμμα

15/3/2018 Ανακοίνωση εργασίας    Εκφώνηση  
29/3/2018 Ορισμός ομάδων και περιγραφή δεδομένων    Οδηγίες 
26/4/2018 Παράδοση αρχικού σχεδιασμού    Οδηγίες
24/5/2018 Παράδοση κώδικα και αναφοράς    Οδηγίες  
25/5/2018 Εξέταση εργασίας    Πρόγραμμα Εξέτασης 


Διαφάνειες

   Εισαγωγή. Ανάκτηση Boole (κεφ 1) Διαφάνειες pptx pdf
   Προ-επεξεργασία κ αι δημιουργία λεξιλογίου. Ευρετήρια καταχωρήσεων. Ερωτήματα φράσεων και γειτονικότητας. (κεφ 2)   Διαφάνειες pptx pdf
   Δομές αναζήτησης για λεξικά. Ανεκτική ανάκτηση: ερωτήσεις με *, ορθογραφικά λάθη, απόσταση όρων, φωνητική διόρθωση. (κεφ 3)   Διαφάνειες pptx pdf
   Περιγραφη Εργασίας. Lucene. Yelp dataset.   Διαφάνειες pptx pdf
   Βαθμολόγηση και διάταξη εγγράφων. Στάθμιση όρων. Το μοντέλο διανυσματικού χώρου. Πλήρες σύστημα αναζήτησης. (κεφ 6-7)    Διαφάνειες pptx pdf
   Πιθανοτική ανάκτηση πληροφορίας. (κεφ 11)    Διαφάνειες pptx pdf
   Κατασκευή ευρετηρίου. Στατιστικά Συλλογής, Συμπίεση. (κεφ 4, 5)    Διαφάνειες pptx pdf
   Αξιολόγηση στη ανάκτηση πληροφορίας. (κεφ 8)    Διαφάνειες pptx pdf
   Θέματα στην ανάκτηση στον ιστό. (κεφ 19-20)    Διαφάνειες pptx pdf
   Ανάλυση συνδέσμων. (κεφ 21)    Διαφάνειες pptx pdf

Διαφάνειες Προηγούμενου Έτους εδώ