MYE003: Ανάκτηση Πληροφορίας

Διδάσκουσα: Ευαγγελία Πιτουρά

Ώρες Διδασκαλίας: Τετάρτη 12:00-14:00
Ώρες Διδασκαλίας: Πέμπτη 12:00-13:00


Ανακοινώσεις


Βιβλία


Ύλη Μαθήματος

Το μάθημα καλύπτει τις βασικές αρχές, αλγόριθμους και εφαρμογές για την ανάκτησης πληροφορίας από συλλογές κειμένων, κοινωνικά δίκτυα και τον ιστό.


Εργασία

Θα δοθεί μια εργασία (project) που θα αφορά την υλοποίηση ενός συστήματος ανάκτησης πληροφορίας με χρήση lucene. Αυτή τη χρονιά, η εργασία θα αφορά δεδομένα που θα συλλέξετε από κοινωνικά δίκτυα.

Η εργασία θα γίνει σε ομάδες των 2 ατόμων.

Προκαταρκτικό Χρονοδιάγραμμα

15/3/2017 Αρχική εκφώνηση εργασίας    εδώ  
30/3/2017 Ορισμός ομάδων και περιγραφή δεδομένων    Οδηγίες 
6/4/2017 Παράδοση αρχικού σχεδιασμού    Οδηγίες
24/5/2017 Παράδοση κώδικα και αναφοράς    Οδηγίες  
26/5/2017 Εξέταση εργασίας    Πρόγραμμα Εξέτασης 


Διαφάνειες

   Εισαγωγή. Ανάκτηση Boole (κεφ 1) Διαφάνειες pptx pdf
   Προ-επεξεργασία και δημιουργία λεξιλογίου. Ευρετήρια καταχωρήσεων. Ερωτήματα φράσεων και γειτονικότητας. (κεφ 2)   Διαφάνειες pptx pdf
   Δομές αναζήτησης για λεξικά. Ανεκτική ανάκτηση: ερωτήσεις με *, ορθογραφικά λάθη, απόσταση όρων, φωνητική διόρθωση. (κεφ 3)   Διαφάνειες pptx pdf
   Βαθμολόγηση και διάταξη εγγράφων. Στάθμιση όρων. Το μοντέλο διανυσματικού χώρου. Πλήρες σύστημα αναζήτησης. (κεφ 6-7)    Διαφάνειες pptx pdf
   Πιθανοτική ανάκτηση πληροφορίας. Περιλήψεις αποτελεσμάτων. (κεφ 11, 8)    Διαφάνειες pptx pdf
   Κατασκευή ευρετηρίου. Στατιστικά συλλογής. Συμπίεση. (κεφ 4-5)      Διαφάνειες pptx pdf
   Αξιολόγηση στην ανάκτηση πληροφορίας. (κεφ. 8)    Διαφάνειες pptx pdf
   Ανάλυση Συνδέσμων. (κεφ 21) Διαφάνειες pptx pdf
   Θέματα στην Ανάκτηση στον Ιστό. (κεφ 19-20) Διαφάνειες pptx pdf
   Lucene Διαφάνειες pdf
   Twitter Crawler Διαφάνειες pptx pdf

Διαφάνειες Προηγούμενου Έτους εδώ