Data Mining, a Course by Blog

Entries categorized as 'σημειώσεις'

Διάλεξη 07: Αλγόριθμοι Εκμάθησης, μέρος Γ’ (Συναρτήσεις & μεταμαθησιακοί αλγόριθμοι) (video)

May 13, 2008 · No Comments

Ακολουθούν τα videos και οι διαφάνειες της Διάλεξης 07 με αντικείμενο γραμμικά μοντέλα, μηχανές διανυσμάτων υποστήριξης, νευρωνικά δίκτυα και μετα-μαθησιακούς αλγορίθμους.

Ωρα πρώτη: Γραμμικά μοντέλα & support vector machines

Ώρα δεύτερη: Νευρωνικά δίκτυα & μεταμαθησιακοί αλγόριθμοι

Διαφάνειες: Lecture07_Algorithms_linear,supportvectors,neuralnets,metaalgorithms.pdf

Categories: video · σημειώσεις

Διάλεξη 06: Αλγόριθμοι εκμάθησης Μέρος Β: Bayes, Κανόνες Συσχέτισης, Αδρανής Εκμάθηση & Ομαδοποίηση (video)

May 6, 2008 · No Comments

Categories: video · σημειώσεις

Διάλεξη 04: Απεικόνιση Γνώσης, Αξιοπιστία & Αποτίμηση (video)

April 8, 2008 · No Comments

Ακολουθεί η μαγνητοσκόπηση της Διάλεξης 4. Το Μέρος ‘Α περιλαμβάνει τις διάφορες μορφές απεικόνισης γνώσης, ενώ το Μέρος Β’ εστιάζει σε θέματα αξιοπιστίας και αποτίμησης.

Μέρος ‘Α: Απεικόνιση Γνώσης

Μέρος Β’: Αξιοπιστία & Αποτίμηση

Ακολουθεί και το .pdf της διάλεξης, ιδιαίτερα χρήσιμο αυτή τη φορά λόγω του βιαστικού της διάλεξης.

Lecture04_KnowledgeRepresentationCredibilityEvaluation.pdf

Categories: video · σημειώσεις

Διάλεξη 03: Προεπεξεργασία & Επιλογή Δεδομένων (video)

April 1, 2008 · No Comments

 Πρώτη ώρα διάλεξης:

Δεύτερη ώρα διάλεξης:

 

Διαφάνειες διάλεξης: lecture03_datapreprocessattributeselection (.pdf)

Categories: video · σημειώσεις

Οπτική διερεύνηση δεδομένων

March 19, 2008 · 2 Comments

Οι δυνατότητες οπτικής διερεύνησης δεδομένων του Weka δεν με άφησαν και με το στόμα ανοιχτό. Επίσης οι περιγραφικοί στατιστικοί δείκτες των attributes είναι μάλλον φτωχοί (έχει διάμεσο, επικρατούσα τιμή /mode, λοξότητα, κύρτωση, ποσοστημόρια;). Πώς διαπιστώνεται ότι μια τιμή είναι στα σίγουρα outlier (βάσει του τύπου); Στο visualization φαίνονται τα correlation scatterplots αλλά που είναι ο correlation matrix ώστε να δούμε και τις τιμές;.  

Θα πρότεινα σε όσους ενδιαφέρονται να έχουν στη «φαρέτρα» τους το εργαλείο GGobi http://www.ggobi.org. Το GGobi βοηθά στην οπτική διερεύνηση πολυμεταβλητών δεδομένων μέσω δυναμικών και interactive γραφικών εργαλείων όπως tours, scatterplots (2D, 3D), barcharts, parallel coordinates plots, time series plots κλπ. Ενδεικτικά αναφέρω ότι δίνει τη δυνατότητα να ανοιχθούν πολλά διαφορετικά παράθυρα με διάφορες απεικονίσεις των δεδομένων και στη συνέχεια με ένα brush tool να χρωματίζεις μια ομάδα ή και μια μοναδική instance και αυτόματα να βλέπεις στα άλλα διαγράμματα με το ίδιο χρώμα τη θέση της. (σημειώτεον ότι μπορεί να εμφανίζει και labels ώστε να ξέρεις για ποιά instance πρόκειται). Συγκεκριμένα με το parallel coordinates plot μπορείς εύκολα να δεις τι τιμές έχει μια instance που είναι outlier για μια attribute σε όλες τις υπόλοιπες.

Δείτε π.χ. το Brushing video στη σελίδα http://www.ggobi.org/docs/parallel-coordinates/

parallel1.jpg 

Τέλος να πω για τους γνώστες της R ότι υπάρχει το package rggobi μέσω του οποίου κάνει κανείς χρήση του GGobi από την R. H χρήση του μπορεί να γίνει μέσω του γραφικού package Rattle (data mining GUI for R), το οποίο παρέχει πρόσβαση (με γραφικό περιβάλλον) σε διάφορα data mining και statistical packages της R.

Categories: σημειώσεις

Διάλεξη 02: Συνιστώσες Δεδομένων, Οπτικοποίηση & Εξερεύνηση (video)

March 18, 2008 · No Comments

Μέρος ‘Α, θεωρία κυρίως και λίγο από weka προς το τέλος

Μέρος ‘Β, άλλο λίγο weka και διευκρινήσεις επί των ασκήσεων

‘Ολα τα videos βρίσκονται διθέσιμα και εδώ.

Categories: video · σημειώσεις

Διάλεξη 01: Εισαγωγή (video)

March 11, 2008 · No Comments

Ακολουθεί το video και οι σημειώσεις της παρουσίασης της πρώτης διάλεξης του μαθήματος.

Δυστυχώς ξέχασα να πατήσω το record στην πρώτη ώρα της διάλεξης, το video περιλαμβάνει μόνο την δεύτερη ώρα, παρακαλώ θυμίστε τό μου στην επόμενη¹ :).

Διάλεξη01_Εισαγωγή.pdf

¹Κρίμα ειδικά για τους εξωτερικούς παρατηρητές, θα ήταν μάλλον ιδιαίτερα χρήσιμη για να παρακολουθήσει κανείς και τη συνέχεια του μαθήματος. Ίσως προσπαθήσω να τη μαγνητοσκοπήσω κάποια στιγμή.

Categories: video · σημειώσεις

Διάλεξη 00: Παρουσίαση Μαθήματος

February 27, 2008 · 1 Comment

Σήμερα πραγματοποιήθηκε η πρώτη διάλεξη του μαθήματος, περισσότερο αναγνωριστικής φύσεως, όπου επιχειρήθηκε μία σύντομη σκαγράφηση της θεματολογίας που πρόκειται να αναπτυχθεί στην πορεία. Το αρχείο της παρουσίασης είναι διαθέσιμο εδώ, σε μορφή pdf. Όσοι δεν παρευρεθήκατε, για οποιονδήποτε λόγο, δεν θα αντιμετωπίσετε πρόβλημα, καθώς το σύνολο των όσων αναφέρθηκαν θα αναπτυχθούν σε πιο διεξοδικό βαθμό στη διάλεξη της επόμενης Τρίτης (φροντίστε ωστόσο να μου κοινοποιήσετε το email σας για να αποκτήσετε δικαίωμα συγγραφής στο blog).

Ως εργασία μέχρι την επόμενη διάλεξη σας ανατίθεται η συγγραφή ενός post με σύντομο βιογραφικό σας -για να γνωριστούμε και καλύτερα-, μαζί με τους λόγους που σας οδήγησαν στην επιλογή του μαθήματος και το τι αναμένετε να αποκομίσετε από αυτό. Ο τίτλος του post πρέπει να είναι της μορφής ‘Συστάσεις: Όνομα Επώνυμο’ (συμβουλή: θα πρότεινα να μην συνεισφέρετε κάτι ιδιαίτερα πρόχειρο, σε λίγο καιρό μπορεί το συγκεκριμένο post να προκύπτει στα πρώτα αποτελέσματα όταν κάποιος σας αναζητά στο google :)

Categories: σημειώσεις