Διδάσκουσα: Ευαγγελία Πιτουρά
Βοηθός Μαθήματος: Δημήτρης Σουραβλιάς (email: dsouravl@cs.uoi.gr)
Ώρες Διδασκαλίας: Τετάρτη 11:00
Δείτε τη σελίδα για το μάθημα του προηγούμενου έτους εδώ.
Ανακοινώσεις
-
-
-
(1/7)
Τελικοί Βαθμοί εδώ
-
(1/6) Η εξέταση του 2ου Συνόλου
θα γίνει προφορική την Τετάρτη 3 Ιουνίου στις 11 στο εργαστήριο.
-
(26/5) Βαθμοί 1ου Συνόλου εδώ
- (14/5) Θα γίνει προφορική εξέταση στο 1ο Σύνολο Ασκήσεων την Τρίτη 19 Μαΐου.
Η εξέταση είναι ΥΠΟΧΡΕΩΤΙΚΗ . Όσοι δεν παραστούν,
δε θα βαθμολογηθούν στο 1ο Σύνολο Ασκήσεων.
Πρόγραμμα Εξέτασης εδώ
-
(6/5) Το επόμενο μάθημα μεταφέρεται λόγω των φοιτητικών εκλογών την Παρασκευή
15 Μαίου 10:00 - 13:00.
- (29/4)
Νέα προθεσμία παράδοσης της Άσκησης
Δευτέρα 4 Μαίου. +10% σε όσους δώσουν την άσκηση στην παλιά ημερομηνία.
-
(6/4) Το μάθημα θα γίνεται κάθε Τετάρτη στις 11
-
Το επόμενο μάθημα θα είναι την Τετάρτη στις 11 και θα αφορά το εργαλείο
WEKA και τις σχετικές με "clustering" συναρτήσεις του Matlab.
- (17/2) Το πρώτο μάθημα θα γίνει την Τρίτη 10 Μαρτίου 2009.
Διδακτικό Βιβλίο
Υπάρχουν δύο σχετικά βιβλία στα Ελληνικά.
Μ. Βαζιργιάννης και Μ. Χαλκίδη, Εξόρυξη Γνώσης από Βάσεις Δεδομένων.
Τυποθήτω, Νοέμβριος 2003
M. H. Dunham, Data Mining, Εισαγωγικά και Προηγμένα Θέματα Εξόρυξης Γνώσης
από Δεδομένα. Επιμέλεια Ελληνικής Έκδοσης: Β. Βερύκιος και
Γ. Θεοδωρίδης. Εκδόσεις Νέων Τεχνολογιών, 2004.
Επίσης κοιτάξτε το
Ύλη Μαθήματος
Το μάθημα καλύπτει τις βασικές αρχές, αλγόριθμους και εφαρμογές
της εξόρυξης γνώσης από μεγάλα σύνολα δεδομένων.
Πρόγραμμα Διαλέξεων (προκαταρκτικό)
10 Μαρ |
Εισαγωγή |
17 Μαρ |
Συσταδοποίηση Ι
|
24 Μαρ |
Συσταδοποίηση ΙΙ
|
1 Απρ |
WEKA. Matlab.
|
8 Απρ |
Κανόνες Συσχέτισης I.
|
29 Απρ |
Κανόνες Συσχέτισης IΙ
|
6 Μαι |
Κανόνες Συσχέτισης ΙΙ (συνέχεια) Ταξινόμηση I
|
15 Μαι |
Ταξινόμηση ΙΙ
|
20 Μαι |
Εξόρυξη Δεδομένων από τον Παγκόσμιο Ιστό.
|
27 Μαι |
Αποθήκες Δεδομένων
|
Διαφάνειες
- Εισαγωγή
.ppt
.pdf
- Συσταδοποίηση Ι (εισαγωγή στη συσταδοποίηση, αποστάσεις, k-means, Ιεραρχική Συσταδοποίηση)
.ppt
.pdf
- Συσταδοποίηση ΙI (DBSCAN, Εκτίμηση Ποιότητας, BIRCH)
.ppt
.pdf
- Κανόνες Συσχέτισης Ι (ορισμός προβλήματος, ο αλγόριθμος a-priori για συχνά στοιχειοσύνολα, δημιουργία κανόνων συσχέτισης, αντιπροσωπευτικά στοιχειοσύνολα)
.ppt
.pdf
- Κανόνες Συσχέτισης IΙ (ανακεφαλαίωση, άλλοι τρόποι υπολογισμού συχνών στοιχειοσυνόλων, o αλγόριθμος FP-Growth, αποτίμηση κανόνων συσχέτισης)
.ppt
.pdf
- Ταξινόμηση Ι (εισαγωγή, δέντρα απόφασης (εντροπία, Gini, λάθος ταξινόμησης))
.ppt
.pdf
- Ταξινόμηση IΙ (ανακεφαλαίωση, overfitting, τιμές που λείπουν, αποτίμηση μοντέλου, άλλα είδη ταξινομητών (ταξινομητές με κανόνες, k-κοντινότεροι γείτονες))
.ppt
.pdf
- Μηχανές Αναζήτησης
.ppt
.pdf
- Αποθήκες Δεδομένων
.ppt
.pdf
Διαφάνειες Προηγούμενου Έτους εδώ
Βαθμολογία
Τελικό Διαγώνισμα |
x%
|
3 Σύνολα Ασκήσεων |
y% το καθένα
|
Ασκήσεις
- Aσκηση 1
Εκφώνηση pdf
Οδηγίες για την παράδοση pdf
Στην πρώτη άσκηση θα χρησιμοποιήσετε τους αλγόριθμους συσταδοποίησης
σε Matlab ή και σε Weka.
Ακολουθούν οδηγίες από τη Μυρτώ.
- Aσκηση 2
Εκφώνηση pdf
Οδηγίες για εξόρυξη κανόνων συσχέτισης με χρήση WEKA.
Οδηγίες για ταξινόμηση με χρήση WEKA.
Σύνολα δεδομένων
- Aσκηση 3
Εκφώνηση pdf
Data Mining Software
Πηγές Πληροφοριών
Σχετικά Μαθήματα σε Ελληνικά Πανεπιστήμια