Data Mining, a Course by Blog

Διάλεξη 03 - εργασία προς υποβολή

April 1, 2008 · No Comments

Η εργασία που σας ζητείται στα πλαίσια της διάλεξης 03 έχει ως εξής:

Αναφέρετε τα πρώτα βήματα της επεξεργασίας που έχετε πρόθεση να ακολουθήσετε για το dataset ‘training set’ του θέματος. Η αναφορά σας μπορεί να περιλαμβάνει συμπεράσματα και τεχνικές από το σύνολο των όσων έχουν παραδοθεί ως σήμερα στις διαλέξεις του μαθήματος, ενώ δεν είναι ανάγκη να είναι εκτενής, μάλλον το αντίθετο (δοκιμάστε, για παράδειγμα, τη δομή των σκέψεών σας σε μερικά bullets λιγότερων των 20 λέξεων, μαζί με κάποιες εικόνες, επίσης, προτιμήστε να τις αναρτήσετε ως post παρά attached pdf κτλ).

Βέλτιστες λύσεις δεν υπάρχουν (σκεφθείτε και δράστε ελεύθερα!), επίσης πιθανή είναι η μερική επικάλυψη των αναφορών των περισσοτέρων από εσάς. Ωστόσο η εργασία θα κριθεί με βάση τη λογική υποστήριξη των όσων αναφερθούν, επίσης την καινοτομία (σε τμήμα τουλάχιστον του υλικού) έναντι των εργασιών που έχουν υποβληθεί και την υλοποίηση και πληρότητα αυτής.

Categories: εργασίες

Διάλεξη 03: Προεπεξεργασία & Επιλογή Δεδομένων (video)

April 1, 2008 · No Comments

 Πρώτη ώρα διάλεξης:

Δεύτερη ώρα διάλεξης:

 

Διαφάνειες διάλεξης: lecture03_datapreprocessattributeselection (.pdf)

Categories: video · σημειώσεις

April 1, 2008 · 1 Comment

Categories: άλλο

Διάλεξη 03: Προεπεξεργασία & Επιλογή Δεδομένων (live)

April 1, 2008 · No Comments

Categories: άλλο

Εργασία 02: Βαθμολόγηση

April 1, 2008 · 1 Comment

Ακολουθούν η παράθεση και η βαθμολόγηση της εργασίας 02 από όσους έχει υποβληθεί (με σειρά υποβολής):

Σαν γενική παρατήρηση, αναφέρω πως η απόδοσή σας ως προς την κατανόηση των τεχνικών οπτικοποίησης υπήρξε ικανοποιητική, εξ’άλλου και το θέμα δεν είχε ιδιαίτερο βαθμό δυσκολίας. Επίσης ο στόχος εκμάθησης του τρόπου εισαγωγής ενός dataset στο weka νομίζω πως έγινε κατανοητός.

Σε τελευταίο σχόλιο αναφέρω πως ίσως από την επόμενη εργασία η κατανομή της βαθμολογίας προκύψει λιγότερο ‘συγκεντρωτική’, επίσης δεν κατανόησα τον λόγο για τον οποίο καταχωρήσατε όλοι την ανάλυση των datasets σε αρχείο πδφ αντί να το αναρτήσετε κανονικά σε μορφή post με κείμενο και εικόνες. Θα μου το εξηγήσετε από κοντά :)

Categories: εργασίες