Η παρούσα εργασία είναι προαιρετική και η βαθμολογία που θα λάβετε είναι προσθετική στο βαθμό σας (λίγο ακόμα και θα πάρετε όλοι 10, anyway). Επίσης, είναι ουσιαστικά κομμάτι του θέματος και την αναθέτω με σκοπό να σας κάνω να ασχοληθείτε πιο σύντομα με αυτό, δηλαδή τώρα. :)
Οι λεπτομέρειες: Χρησιμοποιείτε όσες και όποιες διαδικασίες προεπεξεργασίας και επιλογής χαρακτηριστικών θέλετε και τον αλγόριθμο M5Rules (classify/ rules/ M5Rules). (Εννοείται πως μπορείτε να χρησιμοποιήσετε και όποιον άλλο αλγόριθμο θέλετε, ωστόσο δεν έχετε διδαχθεί λεπτομέρειες περί αλγορίθμων, οπότε σας υποδεικνύω κάποιον που λειτουργεί :), βρίσκετε μία διαδικασία ικανοποιητική σε όρους σφάλματος στο train set, στη συνέχεια εφαρμόζετε ακριβώς την ίδια στο quiz set και εν τέλει μου αποστέλλετε το αρχείο name_quiz_trialnumber.txt (πχ tziralis_quiz01.txt) με email, το οποίο θα περιλαμβάνει τις εκτιμώμενες τιμές της μεταβλητής output για το quiz set.
Όπως έχει αναφερθεί στην εκφώνηση του θέματος, μπορείτε να αποστείλλετε όσα αρχεία τέτοια θέλετε (με διαφορετικές προγνώσεις κάθε φορά) έως την καταληκτική ημερομηνία υποβολής του θέματος, ωστόσο η αποστολή ενός και μόνο συνόλου προβλέψεων ως την επόμενη δευτέρα είναι αρκετή για να σας δώσει άλλες 5 μονάδες (δεν χρειάζεται να ανεβάσετε κάποιο post με περιγραφή της διαδικασίας που ακολουθήσατε -αν θέλετε μπορείτε βέβαια να ανεβάσετε ένα post, χωρίς πολλά λόγια, ίσως αναφέροντας τηλεγραφικά τα βήματα που ακολουθήσατε με bullets, θα βοηθήσει και τους υπόλοιπους-, κατά τ’ άλλα μου αρκεί και η αποστολή του email).
Ως την τρίτη θα αναρτηθεί post με τις αποδόσεις κάθε dataset σας που θα υπολογίσω από τις γνωστές σε εμένα τιμές της μεταβλητής στόχου του quiz set, οπότε και θα ξεκινήσει ο συναγωνισμός. Ο ‘νικητής’, δηλαδή αυτός που θα υποβάλλει την καλύτερη πρόβλεψη στα πλαίσια αυτής της εργασίας ως και τη δευτέρα θα λάβει 6/5 μονάδες. Ότι απορίες έχετε (ίσως έχω ξεχάσει κάποια πράγματα και προκύψουν αρκετές) μου λέτε..
Σχετικά post περί θέματος ως τώρα:
1 response so far ↓
Εργασία 04: Βαθμολόγηση « Data Mining, a Course by Blog // April 15, 2008 at 10:11 am
[...] 15, 2008 · No Comments Η εργασία 04, όπως έχει αναφερθεί, απαιτεί απλά την υποβολή του πρώτου συνόλου [...]
Leave a Comment