Τελική εξέταση: Τζωρτζάκη Μαρία

ΖΗΤΗΜΑ 1

  1. Αρχικά, ανοίγουμε το CreditData_TrainSet.arff
  2. Κάνουμε ένα οπτικό έλεγχο με το visualize all. Παρατηρούμε όμως, ότι δεν παίρνουμε καμία χρήσιμη πληροφορία, οπότε κρατάμε όλες τις attributes.
  3. Στη συνέχεια, παμε στο select attributes -> attribute evaluator & Search method.
  4. Αφαιρώ την attribute 16 (remove) και αποθηκεύω το καινούριο αρχείο.
  5. Εφαρμόζουμε cross validation με διάφορους αλγόριθμους.
  6. Καταλήγουμε στον Bagging -> MultiBoostAB -> J48, ο οποίος μου έδωσε:  Correctly Classified Instances   75.4667 % & Relative absolute error   66.5391 %
  7. Έπειτα, αφαιρώ την attribute 16 από το CreditData_TestSet.arff  και το αποθηκεύουμε.
  8. Τέλος, τρέχουμε το νέο CreditData_TrainSet.arff με supplied test set το νέο CreditData_TestSet.arff  και αποθηκεύουμε τις προβλέψεις, οι οποίες είναι:

predictions.xls

 

 ΖΗΤΗΜΑ 2 

  Τρέχοντας τους έτοιμους αλγόριθμους PART  & J48 μπορούμε να περιγράψουμε και να επεξηγήσουμε τις συσχετίσεις που υπάρχουν ανάμεσα στα χαρακτηριστικά και την κατηγοριοποίηση του οχήματος. Παρακάτω αναφέρονται ενδεικτικά κάποιοι κανόνες.  Οι αριθμοί στις παρενθέσεις (.. , ..) εκφράζουν τις σωστές και τις λάθος προβλέψεις αντίστοιχα.

  • MAX.LENGTH ASPECT RATIO > 8 AND
    HOLLOWS RATIO > 189 AND
    SKEWNESS ABOUT_MAJOR > 63: van (107.0/2.0)

Εξήγηση: Ο παραπάνω κανόνας λέει ότι εαν MAX.LENGTH ASPECT RATIO > 8 και HOLLOWS RATIO > 189 και SKEWNESS ABOUT_MAJOR > 63 τότε  είναι van και από τις 107 περιπτώσεις όπου ισχύουν τα παραπάνω, οι 2 δύο είναι λάθος. Όμοια εξήγηση έχουν και οι παρακάτω κανόνες.

  • SCALED VARIANCE_MINOR > 309 AND
    DISTANCE CIRCULARITY <= 76 AND
    SKEWNESS ABOUT_MINOR <= 10 AND
    SKEWNESS ABOUT_MAJOR > 64 AND
    CIRCULARITY > 41: bus (107.0/1.0)
  • SCATTER RATIO > 144 AND
    PR.AXIS ASPECT RATIO <= 62 AND
    MAX.LENGTH ASPECT RATIO <= 8 AND
    PR.AXIS ASPECT RATIO <= 61: opel (60.0/29.0)

 

  • ELONGATEDNESS > 46 AND
    MAX.LENGTH ASPECT RATIO > 4 AND
    SCALED RADIUS OF GYRATION <= 124 AND
    KURTOSIS ABOUT_MAJOR <= 28 AND
    MAX.LENGTH RECTANGULARITY > 124: van (9.0)

 

  • SCALED VARIANCE_MAJOR <= 174: saab (12.0/3.0)

 

  • ELONGATEDNESS <= 41 AND
    MAX.LENGTH ASPECT RATIO <= 7 AND
    COMPACTNESS > 95: bus (70.0/1.0)
Advertisements

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s