MYE003: Ανάκτηση Πληροφορίας
Εαρινό Εξάμηνο 2023-2024

Διδάσκουσα: Ευαγγελία Πιτουρά

Ώρες Διδασκαλίας: Τρίτη 13:00-14:00, Τετάρτη 12:00-14:00

Ανακοινώσεις
Βιβλία


Ύλη Μαθήματος

Το μάθημα καλύπτει τις βασικές αρχές, αλγόριθμους και εφαρμογές για την ανάκτησης πληροφορίας από συλλογές κειμένων, κοινωνικά δίκτυα και τον ιστό καθώς και βασικές έννοιες NLP.


Εργασία

Θα δοθεί μια εργασία (project) που θα αφορά την υλοποίηση ενός συστήματος ανάκτησης πληροφορίας με χρήση lucene.

Η εργασία θα γίνει σε ομάδες των 2 ατόμων. Η εργασία θα είναι το 50% του βαθμού σας στο μάθημα.

Προκαταρκτικό Χρονοδιάγραμμα για την Εργασία.

26/3/2024 Aνακοίνωση εργασίας    Εκφώνηση  
17/4/2024 Παράδοση 1ης φάσης    Οδηγίες
22/5/2024 Παράδοση τελικής εργασίας    Οδηγίες
Εβδομάδα 27/5/2024 Εξέταση εργασίας   Πρόγραμμα Εξέτασης

Η εργασία περιλαμβάνει και ένα προαιρετικό τμήμα που αφορά χρήση μηχανικής μάθησης. Η περιγραφή του θα ανακοινωθεί εδώ.

Για όσους το κάνουν: (1) το θέμα αυτό θα μετρά με 20% στο βαθμό και 30% η τελική εξέταση και (2) θα δοθεί bonus +0.5 στον τελικό βαθμό τους. Για τους υπόλοιπους, η τελική εξέταση θα μετρά 50% στο βαθμό.


Διαφάνειες

   Εισαγωγή. (κεφ 1) Διαφάνειες pptx pdf
   Ανάκτηση Boole. (κεφ 1) Διαφάνειες pptx pdf
   Προ-επεξεργασία και δημιουργία λεξιλογίου. (κεφ 2)   Διαφάνειες pptx pdf
   Λεξικό. Ανεστραμένο ευρετήριο θέσεων. (κεφ 2, 3)   Διαφάνειες pptx pdf
   Στατιστικά συλογής. Συμπίεση. (κεφ 5)   Διαφάνειες pptx pdf
   Βαθμολόγηση. Στάθμιση όρων. Διανυσματικό μοντέλο. (κεφ 6)   Διαφάνειες pptx pdf
   Lucene. Περιγραφή εργασίας. Ευρετήρια πεδίου. Περιλήψεις.   Διαφάνειες pptx pdf
   Μηχανική μάθηση στην ανάκτηση πληροφορίας. Διανυσματικές αναπαραστάσεις (embeddings).   Διαφάνειες pptx pdf
   Αξιολόγηση (κεφ, 8)   Διαφάνειες pptx pdf
   Web, μηχανές αναζήτησης (κεφ 19, 20)   Διαφάνειες pptx pdf
   Ανάλυση συνδέσμων (κεφ 21)   Διαφάνειες pptx pdf
   Πρακτικές συμβουλές για την συγγραφή τεχνικών άρθρων   Διαφάνειες pptx pdf

Διαφάνειες Προηγούμενου Έτους εδώ