Εργασία 03:Κατσαβριάς Βαγγέλης

Ανοίγοντας το dataset “training set” παρατηρούμε ότι έχει 40 attributes (όλες numeric) και 2528 Instances. Ακόμα παρατηρούμε ότι δεν έχουμε καμία missing value , έτσι δεν χρειάζεται να χρησιμοποιήσουμε το replace missing values , όπου μας αντικαθιστά τις τιμές αυτές.

img311

Τώρα επιλέγοντας το Visualize All μας εμφανίζονται όλα τα ιστογράμματα των μεταβλητών και έτσι μπορούμε (οπτικά) γρήγορα να καταλάβουμε ότι την attribute 38 δεν την χρειαζόμαστε και την κάνουμε remove:

img32

Όταν έχουμε μεγάλα datasets με πολλά attributes (μεταβλητές) μπορούμε να κρατήσουμε τα πιο σημαντικά. Αυτό το γίνεται πηγαίνοντας στο Select attributes και επιλέγουμε στο Attribute Evaluator:CfsSubsetEval και στο Search Method:BestFirst.

img33

Παρατηρούμε απο το παραπάνω ότι το WEKA μας επέλεξε 10 attributes (6,7,12,13,23,24,27,28,32,35).

Αν τώρα θέλουμε να επιλέξουμε πάλι τα σημαντικότερα attributes, με βάση όμως αυτή τη φορά το attr15, θα έχουμε:

img34

Όπως παρατηρούμε είναι μόνο 4 τα: attr06, attr31, attr39, output.

Επίσης πηγαίνοντας στο Preprocess στο filter αν θέλουμε, με την εντολή add, μπορούμε να βάλουμε μια νέα μεταβλητή:

img35

Τέλος, μερικές φορές για να μπορέσουμε να κάνουμε ανάλυση των δεδομένων χρειάζεται να μετατρέψουμε τις μεταβλητές μας απο numeric σε nominal. Αυτό γίνεται πηγαίνοντας στο Preprocess και επιλέγοντας στο filter το Discretize. Εκεί μπορούμε να επιλέξουμε τις μεταβλητές που θα κάνουμε nominal και τον αριθμό των bins:

img36

με αυτόν το τρόπο θα έχουμε:

img37

One response to “Εργασία 03:Κατσαβριάς Βαγγέλης

  1. Ολοκληρωμένη, 4/5

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s