Τμήμα Μηχανικών Ηλεκτρονικών Υπολογιστών και Πληροφορικής

Πολυτεχνική Σχολή - Πανεπιστήμιο Ιωαννίνων

Εξόρυξη Δεδομένων

Course Feature
Περιγραφή μαθήματος

Κωδικός μαθήματος: ΜΥΕ012

Εβδομαδιαίες ώρες διδασκαλίας: 3,2,0

Εξάμηνο σπουδών: >=6ο

Διδακτικές Μονάδες: 4

Μονάδες ECTS: 5

Ιστοσελίδα Μαθήματος: https://www.cs.uoi.gr/~tsap/teaching/cse012/index-gr.html

Προσφερόμενο: Ακαδημαϊκό έτος 2024-2025

Προαπαιτούμενα:

Περιεχόμενο:

Εισαγωγή στην Εξόρυξη Δεδομένων: Τι είναι η Εξόρυξη Δεδομένων και γιατί είναι σημαντική? Η αλυσίδα (pipeline) της Εξόρυξης Δεδομένων.
Συχνά στοιχειοσύνολα και Κανόνες συσχέτισης: Αλγόριθμοι, Θεωρία, Αξιολόγηση.
Ομοιότητα και Απόσταση: Ορισμοί Ομοιότητας και Απόστασης. Συστήματα συστάσεων. Min-Hashing Sketches και Locality Sensitive Hashing.
Μείωση Διάστασης: Singular Value Decomposition. Principal Component Analysis.
Ομαδοποίηση: Ορισμός της ομαδοποίησης. Διαμεριστική και Ιεραρχική ομαδοποίηση. K-means. Ομαδοποίηση με βάση την πυκνότητα. Ο EM αλγόριθμος. Αξιολόγηση.
Η αρχή της ελάχιστης περιγραφής (Minimum Description Length principle): Εισαγωγή στην θεωρία πληροφορίας. Χρήση της MDL για συν-ομαδοποίηση.
Κατηγοριοποίηση: Δέντρα απόφασης, Logistic Regression, SVM κατηγοριοποίηση, Naïve Bayes κατηγοριοποίηση. Αξιολόγηση.
Link Analysis Ranking: PageRank και HITS. Τυχαίοι περίπατοι. Απορροφητικοί Τυχαίοι Περίπατοι.
Κάλυψη: Το πρόβλημα του ελάχιστου καλύμματος, και της μέγιστης κάλυψης και οι εφαρμογές τους. Προσεγγιστικοί αλγόριθμοι.
Εξόρυξη Δεδομένων με Python: Iron Python, Pandas, η βιβλιοθήκη Sci-Kit.
Εξειδικευμένα θέματα: Το προγραμματιστικό μοντέλο του Map-Reduce.

Παρατηρήσεις: