Ανάκτηση Πληροφορίας
Course Feature
Περιγραφή μαθήματος
Κωδικός μαθήματος: ΜΥΕ003
Εβδομαδιαίες ώρες διδασκαλίας: 3,0,2
Εξάμηνο σπουδών: >=6
Διδακτικές Μονάδες: 4
Μονάδες ECTS: 5
Ιστοσελίδα Μαθήματος: http://ecourse.uoi.gr/enrol/index.php?id=871
Προσφερόμενο: Ακαδημαϊκό έτος 2024-2025
Προαπαιτούμενα:
Περιεχόμενο:
Εισαγωγή στην ανάκτηση πληροφορίας: βασικές έννοιες και εφαρμογές, είδη συστημάτων ανάκτησης πληροφορίας, ανάκτηση Boole.
Προ-επεξεργασία κειμένου: λημματοποίηση, περιστολή, tokens, όροι, αφαίρεση διακοπτόμενων λέξεων.
Είδη ερωτημάτων: ερωτήματα φράσεων, ερωτήματα γειτνίασης, ανοχή σε σφάλματα, απόσταση διόρθωσης, φωνητική διόρθωση, ευρετήριο αντιμετατιθεμένων όρων, ευρετήρια k-γραμμάτων
Μοντέλα ανάκτησης: διανυσματικό μοντέλο, συχνότητα εγγράφου, συχνότητα όρου, πιθανοτικό μοντέλο.
Δομές: Λεξιλόγιο όρων, αναστραμμένο ευρετήριο, λίστες καταχωρήσεων, λεξικό, νόμος του Zipf, νόμος του Heap, βαθμωτά ευρετήρια
Συμπίεση: απωλεστική και μη απωλεστική συμπίεση, κωδικοποίηση μεταβλητού μήκους
Αξιολόγηση: συνάφεια, ακρίβεια, ανάκληση, καμπύλη ακρίβειας/ανάκλησης, μέση αντιπροσωπευτική ακρίβεια, μειούμενο συγκεντρωτικό κέρδος, μέτρο Κάπα.
Μηχανές Αναζήτησης: ανάλυση συνδέσμων, ο αλγόριθμος PageRank, ο αλγόριθμος HITS, διαφημίσεις
Παρατηρήσεις: