Τελική εξέταση: Τζωρτζάκη Μαρία

ΖΗΤΗΜΑ 1

 1. Αρχικά, ανοίγουμε το CreditData_TrainSet.arff
 2. Κάνουμε ένα οπτικό έλεγχο με το visualize all. Παρατηρούμε όμως, ότι δεν παίρνουμε καμία χρήσιμη πληροφορία, οπότε κρατάμε όλες τις attributes.
 3. Στη συνέχεια, παμε στο select attributes -> attribute evaluator & Search method.
 4. Αφαιρώ την attribute 16 (remove) και αποθηκεύω το καινούριο αρχείο.
 5. Εφαρμόζουμε cross validation με διάφορους αλγόριθμους.
 6. Καταλήγουμε στον Bagging -> MultiBoostAB -> J48, ο οποίος μου έδωσε:  Correctly Classified Instances   75.4667 % & Relative absolute error   66.5391 %
 7. Έπειτα, αφαιρώ την attribute 16 από το CreditData_TestSet.arff  και το αποθηκεύουμε.
 8. Τέλος, τρέχουμε το νέο CreditData_TrainSet.arff με supplied test set το νέο CreditData_TestSet.arff  και αποθηκεύουμε τις προβλέψεις, οι οποίες είναι:

predictions.xls

 

 ΖΗΤΗΜΑ 2 

  Τρέχοντας τους έτοιμους αλγόριθμους PART  & J48 μπορούμε να περιγράψουμε και να επεξηγήσουμε τις συσχετίσεις που υπάρχουν ανάμεσα στα χαρακτηριστικά και την κατηγοριοποίηση του οχήματος. Παρακάτω αναφέρονται ενδεικτικά κάποιοι κανόνες.  Οι αριθμοί στις παρενθέσεις (.. , ..) εκφράζουν τις σωστές και τις λάθος προβλέψεις αντίστοιχα.

 • MAX.LENGTH ASPECT RATIO > 8 AND
  HOLLOWS RATIO > 189 AND
  SKEWNESS ABOUT_MAJOR > 63: van (107.0/2.0)

Εξήγηση: Ο παραπάνω κανόνας λέει ότι εαν MAX.LENGTH ASPECT RATIO > 8 και HOLLOWS RATIO > 189 και SKEWNESS ABOUT_MAJOR > 63 τότε  είναι van και από τις 107 περιπτώσεις όπου ισχύουν τα παραπάνω, οι 2 δύο είναι λάθος. Όμοια εξήγηση έχουν και οι παρακάτω κανόνες.

 • SCALED VARIANCE_MINOR > 309 AND
  DISTANCE CIRCULARITY <= 76 AND
  SKEWNESS ABOUT_MINOR <= 10 AND
  SKEWNESS ABOUT_MAJOR > 64 AND
  CIRCULARITY > 41: bus (107.0/1.0)
 • SCATTER RATIO > 144 AND
  PR.AXIS ASPECT RATIO <= 62 AND
  MAX.LENGTH ASPECT RATIO <= 8 AND
  PR.AXIS ASPECT RATIO <= 61: opel (60.0/29.0)

 

 • ELONGATEDNESS > 46 AND
  MAX.LENGTH ASPECT RATIO > 4 AND
  SCALED RADIUS OF GYRATION <= 124 AND
  KURTOSIS ABOUT_MAJOR <= 28 AND
  MAX.LENGTH RECTANGULARITY > 124: van (9.0)

 

 • SCALED VARIANCE_MAJOR <= 174: saab (12.0/3.0)

 

 • ELONGATEDNESS <= 41 AND
  MAX.LENGTH ASPECT RATIO <= 7 AND
  COMPACTNESS > 95: bus (70.0/1.0)

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s