Ανδρουλάκης Μάνος-Εξέταση

Ζήτημα 1

 

 

Τα βήματα που ακολουθήσαμε ήταν τα εξής:

 

ü      Προεπισκόπηση των δεδομένων με χρήση του tabvisualize all”.

 

ü      Δε συνίσταται μέχρι στιγμής να αφαιρέσουμε κάποιο attribute.

 

ü      Συνεχίζουμε με το tab select attributes.

 

ü      Έπειτα από χρήση όλων των αλγορίθμων καταλήξαμε στην αφαίρεση των 5, 13 και 16.

 

ü      Αποθήκευση του καινούργιου trainset.

 

ü      Εφαρμογή του αλγορίθμου Bagging+AdaBoost+RepTree στο καινούργιο train set με crossvalidation.

 

ü      Πήραμε ποσοστό των Correctly Classified Instances 73,2%.

 

ü      Αφαίρεση των ίδιων μεταβλητών, 5, 13 και 16 στο test set.

 

ü      Εφαρμογή του αλγορίθμου με supplied set το καινούργιο test set.

 

ü      Τέλος, εξάγουμε τα predictions.

 

 

 

Ζήτημα 2

 

 

Κάνοντας χρήση του αλγορίθμου PART προκύπτουν τα παρακάτω πρότυπα, στηριζόμενοι τόσο στο μέγεθος του προτύπου καθώς και στο ποσοστό των σωστών προβλέψεων:

 

ü      Εάν ELONGATEDNESS <= 41 και MAX.LENGTH ASPECT RATIO <= 7 και COMPACTNESS > 95 τότε class=bus (70.0/1.0).

 

ü      Εάν MAX.LENGTH ASPECT RATIO > 8 και HOLLOWS RATIO > 189 και SKEWNESS ABOUT_MAJOR > 63 τότε class=van (107.0/2.0).

 

ü      Εάν SCALED VARIANCE_MINOR > 309 και DISTANCE CIRCULARITY <= 76 και SKEWNESS ABOUT_MINOR <= 10 και SKEWNESS ABOUT_MAJOR > 64 και CIRCULARITY > 41 τότε class=bus (107.0/1.0).

 

 

Συνεχίζουμε και με χρήση του αλγορίθμου JΡip για εξαγωγή περισσοτέρων προτύπων. Προέκυψαν τα εξής:

 

ü      ELONGATEDNESS >= 43 και MAX.LENGTH ASPECT RATIO >= 9 και DISTANCE CIRCULARITY >= 73 τότε Class=van (86.0/0.0).

 

ü      Εάν MAX.LENGTH ASPECT RATIO >= 9 και DISTANCE CIRCULARITY >= 100 και SCALED VARIANCE_MAJOR <= 231 τότε Class=saab (71.0/9.0).

 

ü      Εάν MAX.LENGTH ASPECT RATIO >= 8 και MAX.LENGTH RECTANGULARITY >= 173 τότε Class=opel (45.0/8.0, οπότε το δεχόμαστε οριακά).

 

ü      Εάν PR.AXIS RECTANGULARITY <= 18) και MAX.LENGTH RECTANGULARITY >= 128 και SCALED RADIUS OF GYRATION <= 140 τότε Class=van (42.0/6.0, οπότε το δεχόμαστε οριακά).

 

 

Ακολουθούν τα predictions του πρώτου ζητήματος. 

predictions1

 

Advertisements

One response to “Ανδρουλάκης Μάνος-Εξέταση

  1. Ζήτημα 1: Εξαιρετική ανάπτυξη του θέματος (το ‘χρήση όλων των αλγορίθμων’ σηκώνει συζήτηση, προφανώς εκτός του πλαισίου της εξέτασης.Καλό ποσοστό σφάλματος.
    Ανάπτυξη: 10 / 10
    Αξιοπιστία προβλέψεων: 7 / 10
    Ζήτημα 2: Εξαιρετική και λιτή ανάπτυξη, 10 / 10

    Σύνολο: 27/30

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s