Τελική Εξέταση: Μιχαηλίδου Χριστίνα

classtxtΖήτημα 1ο:
Αρχικά επιλέγουμε τις μεταβλητές που θα κρατήσουμε για το train και test set.
-Από το preprocess επιλέγουμε Visualize All και κάνουμε οπτικό έλεγχο.
-Από τον οπτικό έλεγχο βλέπουμε ότι οι μεταβλητές 4,19 δεν προσφέρουν ιδιαίτερη πληροφορία και τις αφαιρούμε.
-Από το Select Attributes δοκιμάζουμε διάφορους συνδυασμούς αλγορίθμων για την τελική επιλογή μεταβλητών.
-Οι περισσότεροι συνδυασμοί δίνουν ή όλες τις μεταβλητές ή μόνο 3, οπότε καταλήγουμε στην αρχική επιλογή απ’τον οπτικό έλεγχο (όλες εκτός από 4,19)
-Από το Classify δοκιμάζουμε διάφορους meta αλγορίθμους σε συνδυασμό με rules & trees.
-Τελικά επιλέγουμε το meta–>Decorate–>J48 (Debug=True) που δίνει incorrectly instances: 26.2667 %
-Εφαρμόζουμε το ίδιο και στο test set για να πάρουμε τα output predictions.

Ζήτημα 2ο:

Αρχικά επιλέγουμε να κρατήσουμε κάποιες από τις μεταβλητές του vehicle set.
Select Attributes –> CfsSubsetEval –> BestFirst
Η παραπάνω μέθοδος μας υποδεικνύει να κρατήσουμε τις μεταβλητές 4,5,6,7,8,9,11,12,14,15,16 , στο πλήθος 11.
Εφαρμόζουμε διάφορα rules και trees στο καινούριο vehicle set ώστε να βρούμε τους “καλύτερους” κανόνες που οδηγούν στο σωστό αποτέλεσμα της μεταβλητής στόχου.
Εφαρμόζοντας τον κανόνα PART και βάζοντας το reducedErrorPurning ->True παίρνουμε 17 κανόνες, από τους οποίους επιλέγουμε τους παρακάτω 10 (με λιγότερο σφάλμα):

PART decision list:

ELONGATEDNESS <= 41 AND
MAX.LENGTH ASPECT RATIO 67 AND
RADIUS RATIO > 170: bus (51.0/1.0)

ELONGATEDNESS <= 41 AND
PR.AXIS ASPECT RATIO <= 52 AND
ELONGATEDNESS <= 29: bus (4.0)

ELONGATEDNESS 74 AND
MAX.LENGTH ASPECT RATIO > 8: opel (4.0)

SCALED VARIANCE_MINOR <= 307 AND
KURTOSIS ABOUT_MAJOR 7: van (20.0/2.0)

MAX.LENGTH ASPECT RATIO 63 AND
SCALED VARIANCE_MAJOR <= 180 AND
ELONGATEDNESS <= 48: bus (21.0/1.0)

PR.AXIS RECTANGULARITY > 24: opel (13.0)

SCATTER RATIO 153 AND
MAX.LENGTH ASPECT RATIO > 6: van (7.0)

SKEWNESS ABOUT_MAJOR 61 AND
PR.AXIS RECTANGULARITY 149: opel (12.0/2.0)

SCALED VARIANCE_MINOR > 319 AND
SKEWNESS ABOUT_MAJOR > 72 AND
SKEWNESS ABOUT_MINOR <= 10: bus (11.0)

Στις παρενθέσεις είναι τα correctly και τα Incorrectly classified instances σύμφωνα με τον κάθε κανόνα(διαχωρίζονται με το / ). Μετά την άνω και κάτω τελεία έχουμε την τιμή της μεταβλητής class που δίνει ο κανόνας (π.χ. saab, opel κλπ).

Advertisements

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s