Εξόρυξη Δεδομένων
Course Feature
Περιγραφή μαθήματος
Κωδικός μαθήματος: ΜΥΕ012
Εβδομαδιαίες ώρες διδασκαλίας: 3,2,0
Εξάμηνο σπουδών: >=6ο
Διδακτικές Μονάδες: 4
Μονάδες ECTS: 5
Ιστοσελίδα Μαθήματος: https://www.cs.uoi.gr/~tsap/teaching/cse012/index-gr.html
Προσφερόμενο: Ακαδημαϊκό έτος 2024-2025
Προαπαιτούμενα:
Περιεχόμενο:
Εισαγωγή στην Εξόρυξη Δεδομένων: Τι είναι η Εξόρυξη Δεδομένων και γιατί είναι σημαντική? Η αλυσίδα (pipeline) της Εξόρυξης Δεδομένων.
Συχνά στοιχειοσύνολα και Κανόνες συσχέτισης: Αλγόριθμοι, Θεωρία, Αξιολόγηση.
Ομοιότητα και Απόσταση: Ορισμοί Ομοιότητας και Απόστασης. Συστήματα συστάσεων. Min-Hashing Sketches και Locality Sensitive Hashing.
Μείωση Διάστασης: Singular Value Decomposition. Principal Component Analysis.
Ομαδοποίηση: Ορισμός της ομαδοποίησης. Διαμεριστική και Ιεραρχική ομαδοποίηση. K-means. Ομαδοποίηση με βάση την πυκνότητα. Ο EM αλγόριθμος. Αξιολόγηση.
Η αρχή της ελάχιστης περιγραφής (Minimum Description Length principle): Εισαγωγή στην θεωρία πληροφορίας. Χρήση της MDL για συν-ομαδοποίηση.
Κατηγοριοποίηση: Δέντρα απόφασης, Logistic Regression, SVM κατηγοριοποίηση, Naïve Bayes κατηγοριοποίηση. Αξιολόγηση.
Link Analysis Ranking: PageRank και HITS. Τυχαίοι περίπατοι. Απορροφητικοί Τυχαίοι Περίπατοι.
Κάλυψη: Το πρόβλημα του ελάχιστου καλύμματος, και της μέγιστης κάλυψης και οι εφαρμογές τους. Προσεγγιστικοί αλγόριθμοι.
Εξόρυξη Δεδομένων με Python: Iron Python, Pandas, η βιβλιοθήκη Sci-Kit.
Εξειδικευμένα θέματα: Το προγραμματιστικό μοντέλο του Map-Reduce.
Παρατηρήσεις: