Εργασία 03:Μουτσανά Βίκυ

Ένα αρχικό βήμα πριν την επεξεργασία των δεδομένων μας είναι η οπτική μελέτη τους. Στη συγκεκριμένη περίπτωση όλα τα δεδομένα μας είναι numeric κι έτσι η εξαγωγή συμπερασμάτων δεν είναι πολύ εύκολη. Μπορούμε όμως να παρατηρήσουμε ότι:

 1. Η πλειοψηφία των attributes έχει ιστογράμματα παρόμοιας μορφής, συγκεκριμένα οι περισσότερες τιμές τους συγκεντρώνονται στην πρώτη ράβδο του ιστογράμματος και σε ελάχιστες περιπτώσεις βρίσκουμε μεγάλο αριθμό τιμών σε κάποια άλλη ράβδο.
 2. Το attribute που ίσως παρουσιάζει ενδιαφέρον είναι το 37 όπως βλέπουμε και από το παρακάτω ιστόγραμμα το οποίο μας θυμίζει το γράφημα της εκθετικής κατανομής.

image12

3.Επίσης από το ιστόγραμμα του attribute 38 δεν αντλούμε πολύτιμες πληροφορίες αφού αυτό θυμίζει το γράφημα της ομοιόμορφης κατανομής στην οποία τα δεδομένα έχουν όλα το ίδιο βάρος. Έτσι θα μπορούσαμε να το αφαιρέσουμε χωρίς να έχουμε μεγάλο κόστος.

image21

Στη συνέχεια μπορούμε να πειραματιστούμε επιλέγοντας τα κατάλληλα φίλτρα στο weka και να καταλήξουμε σε ένα μικρότερο πλήθος μεταβλητών για μελέτη σε σχέση με το αρχικό.

Δοκιμάζουμε λοιπόν διαφορετικές μεθόδους αποτίμησης και αναζήτησης χαρακτηριστικών ή υποσυνόλου χαρακτηριστικών.

Διαπιστώνουμε ότι:

Εάν επιλέξουμε τους συνδυασμούς CfsSubsetEvalBestFirst, CfsSubsetEvalSubsetForwardSelection, CfsSubsetEvalScatterSearch καταλήγουμε σε 10 χαρακτηριστικά έναντι των 39 που είχαμε αρχικά. Στις 2 πρώτες περιπτώσεις τα χαρακτηριστικά αυτά συμπίπτουν ενώ στην 3η είναι διαφορετικά (βλ. παρακάτω)

image31

image41

Τέλος με το συνδυασμό CfsSubsetEvalGeneticSearch φαίνεται ότι τελικά καταλήγουμε σε 8 attribute ενώ με τον CfsSubsetEvalGreedyStepwise σε 11.

image51

  One response to “Εργασία 03:Μουτσανά Βίκυ

  Leave a Reply

  Fill in your details below or click an icon to log in:

  WordPress.com Logo

  You are commenting using your WordPress.com account. Log Out / Change )

  Twitter picture

  You are commenting using your Twitter account. Log Out / Change )

  Facebook photo

  You are commenting using your Facebook account. Log Out / Change )

  Google+ photo

  You are commenting using your Google+ account. Log Out / Change )

  Connecting to %s