Εργασία 03: Μιχαηλίδου Χριστίνα

Με μία πρώτη ματιά από τα ιστογράμματα των attributes με το στόχο (output) βλέπουμε ότι κάποια χαρακτηριστικά δε μας δίνουν καμία πληροφορία (atr34, atr38) και κάποια άλλα δίνουν παρόμοιες πληροφορίες, άρα θα μπορούσαν να ομαδοποιηθούν με κάποιο τρόπο ή να κρατήσουμε ένα απο αυτά. Π.χ. τα atr1, atr2 atr8 δίνουν παρόμοια τιμή (περίπου 2450) όταν είναι < 0,18 ή 0,12:

eikona1

eikona2

eikona3

Στην καρτέλα Select Attributes διαλέγω τη μέθοδο Best First για επιλογή χαρακτηριστικών με στόχο το output. Έτσι τελικά έχω καταλήξει στα εξής χαρακτηριστικά:

eikona4

Τελικά μόνο 10 από τα 40 χαρακτηριστικά αξίζει να λάβουμε υπ’όψιν για το στόχο μας.
Τώρα έχοντας κρατήσει μόνο αυτά τα 10 χαρακτηριστικά (κάνοντας Remove στα υπόλοιπα), εφαρμόζω το φίλτρο RemoveMisclassified (και decision table) για να διώξω τα outliers από τα instances. Από 2528 instances μένουν μόνο 1600!
eikona5

2 responses to “Εργασία 03: Μιχαηλίδου Χριστίνα

  1. To RemoveMisclassified δεν απομακρύνει τα outliers, αλλά όλα εκείνα τα instances που δεν έχουν ταξινομηθεί σωστά από τον εκάστοτε classifier που έει επιλεγεί μέσα στην εντολή.
    Βαθμός 4/5

  2. χριστινα

    Όμως στο βιβλίο έλεγε
    RemoveMisclassified Remove instances incorrectly classified according to a specified
    classifier—useful for removing outliers

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s