Νανούρης Νικόλαος: Τελική Εξέταση

Θέμα 1

1. Η οπτικοποίηση των δεδομένων δεν οδηγεί στην απόρριψη κάποιας   μεταβλητής.

2. Παρατηρούμε ότι η μεταβλητή foreign_workers ίσως δεν είναι σημαντική.

3. Η χρήση αξιολογητών μεταβλητών προτείνει μόνο τις τρεις πρώτες μεταβλητές.

4. Χρήση αλγορίθμων όλων των κατηγοριών και της τεχνικής διασταυρωμένης επικύρωσης.

5. Παρατηρείται υπεροχή της Μπεϋζιανής κατηγορίας, ενδεχομένως λόγω παρουσίας θορύβου.

6. Όλες οι μεταβλητές: 27.73% με RandomForest, 26% με SMO, 25.6% με NaiveBayes.

7. Αφαίρεση της foreign_workers: 25.47% με RandomForest, 26.53% με SMO, 25.73% με NaiveBayes.

8. Χρήση μόνο των μεταβλητών 1, 2, 3: 32.27% με RandomForest, 28% με SMO, 26.27% με NaiveBayes.

9. Χρήση μεταμαθησιακών αλγορίθμων με όλες τις μεταβλητές. Υπεροχή NaiveBayes ως εμβόλιμου αλγόριθμου.

10. Βέλτιστη επιλογή: MultiBoostAB+NaiveBayes με ποσοστό αποτυχίας 25.07%.

Nanouris_Nikolaos

 

Θέμα 2

1. Χρήση του αλγόριθμου PART με κατάλληλη επιλογή του ελάχιστου αριθμού αντικειμένων (αρκετά υψηλό) ώστε να αποκαλυφθούν οι σημαντικότεροι κανόνες:

PART decision list
——————

ELONGATEDNESS <= 41 AND
MAX.LENGTH ASPECT RATIO <= 7: bus (107.0/21.0)

ELONGATEDNESS <= 41 AND
COMPACTNESS <= 106 AND
MAX.LENGTH RECTANGULARITY <= 172 AND
HOLLOWS RATIO > 196 AND
MAX.LENGTH ASPECT RATIO > 9: saab (73.0/29.0)

ELONGATEDNESS <= 41 AND
COMPACTNESS <= 106 AND
MAX.LENGTH ASPECT RATIO > 9: opel (64.0/10.0)

ELONGATEDNESS <= 41 AND
PR.AXIS RECTANGULARITY <= 23 AND
SKEWNESS ABOUT_MAJOR <= 67: opel (52.0/23.0)

ELONGATEDNESS > 41 AND
MAX.LENGTH ASPECT RATIO <= 8 AND
SCALED VARIANCE_MINOR > 305 AND
MAX.LENGTH RECTANGULARITY > 134: bus (146.0/31.0)

ELONGATEDNESS > 41 AND
MAX.LENGTH RECTANGULARITY > 138: van (152.0/10.0)

PR.AXIS RECTANGULARITY > 18: saab (139.0/55.0)

MAX.LENGTH RECTANGULARITY > 127: van (67.0/26.0)

: saab (46.0/26.0)

Number of Rules  :  9

Παρατηρήσεις:

  • Έχουμε τους 9 βασικότερους κανόνες, από τους οποίους μερικοί διακρίνονται ακόμα περισσότερο: πρόκειται για τον πρώτο, πέμπτο, έκτο και έβδομο κανόνα.
  • Η σημαντικότερη πληροφορία, σύμφωνα με τον πρώτο και τον έκτο κανόνα, είναι η διαπίστωση ότι το elongatedness είναι καθοριστικός παράγοντας της ταξινόμησης (κάτω από 41, τότε bus και πάνω από 41, τότε van).

2. Χρήση του αλγόριθμου J48 με κατάλληλη επιλογή του ελάχιστου αριθμού αντικειμένων (αρκετά υψηλό) ώστε να αποκαλυφθούν οι σημαντικότεροι κανόνες:

J48 pruned tree
——————

ELONGATEDNESS <= 41
|   MAX.LENGTH ASPECT RATIO <= 7: bus (107.0/21.0)
|   MAX.LENGTH ASPECT RATIO > 7
|   |   SCALED VARIANCE_MINOR <= 721
|   |   |   HOLLOWS RATIO <= 195: opel (39.0/7.0)
|   |   |   HOLLOWS RATIO > 195: saab (213.0/84.0)
|   |   SCALED VARIANCE_MINOR > 721: opel (23.0/1.0)
ELONGATEDNESS > 41
|   MAX.LENGTH ASPECT RATIO <= 8
|   |   SCALED VARIANCE_MINOR <= 305
|   |   |   MAX.LENGTH RECTANGULARITY <= 138
|   |   |   |   PR.AXIS RECTANGULARITY <= 17: van (39.0/12.0)
|   |   |   |   PR.AXIS RECTANGULARITY > 17
|   |   |   |   |   MAX.LENGTH RECTANGULARITY <= 128: opel (32.0/16.0)
|   |   |   |   |   MAX.LENGTH RECTANGULARITY > 128
|   |   |   |   |   |   SCALED RADIUS OF GYRATION <= 140: van (21.0/4.0)
|   |   |   |   |   |   SCALED RADIUS OF GYRATION > 140: opel (20.0/11.0)
|   |   |   MAX.LENGTH RECTANGULARITY > 138: van (46.0/4.0)
|   |   SCALED VARIANCE_MINOR > 305
|   |   |   DISTANCE CIRCULARITY <= 76
|   |   |   |   SKEWNESS ABOUT_MINOR <= 10: bus (137.0/15.0)
|   |   |   |   SKEWNESS ABOUT_MINOR > 10: opel (20.0/9.0)
|   |   |   DISTANCE CIRCULARITY > 76: opel (33.0/16.0)
|   MAX.LENGTH ASPECT RATIO > 8: van (116.0/10.0)

Number of Leaves  :  13

Size of the tree :  25

Παρατηρήσεις:

  • Έχουμε τα 13 βασικότερα φύλλα ταξινόμησης, από τα οποία τα δύο είναι ιδιαίτερα χαρακτηριστικά: πρόκειται για εκείνα τα οποία καθορίζονται από τη μεταβλητή elongatedness της οποίας η τιμή 41 οδηγεί σε πιο ενδελεχή διαχωρισμό των αποτελεσμάτων.
  • Οι δύο αλγόριθμοι συμφωνούν σε μεγάλο βαθμό ως προς την επιλογή του παράγοντα elongatedness ο οποίος μπορεί με ασφάλεια να θεωρηθεί ο πιο κρίσιμος για το σχεδιασμό της εταιρείας που πραγματοποίησε τη συγκεκριμένη μελέτη.
Advertisements

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s