Τελική_Εξέταση:Ζαχαρίδου_Ηρώ

Ζήτημα 1

 

Το train set που μας δόθηκε  περιέχει 750 υποδείγματα και το test set 250.

 

·        Με μια πρώτη ματιά δεν φαίνεται να μπορεί  να απαλειφθεί κάποιο χαρακτηριστικό(Visualize All)

·        Χρησιμοποιήθηκαν κάποια από τα φίλτρα  του Attribute Selection

(π.χ.  το GainRatioAttributeEval-Ranker επέλεξε τις

 

1,20,3,2,6,10,14,15,4,9,7,12,17,19,13,18,8,11,5,16 : 20),

αλλά τελικά δεν αφαιρέθηκε κανένα attribute.

·        Αρχικά έγινε εφαρμογή διάφορων αλγορίθμων με χρήση cross validation  στο train set.

 

Παρακάτω δίνονται δύο παραδείγματα

 

weka.classifiers.meta.RacedIncrementalLogitBoost

 

Correctly Classified Instances         527               70.2667 %

Incorrectly Classified Instances       223               29.7333 %

Kappa statistic                          0    

Mean absolute error                      0.4181

Root mean squared error                  0.4571

Relative absolute error                100      %

Root relative squared error            100      %

Total Number of Instances              750    

 

 

weka.classifiers.meta.Bagging -P 100 -S 1 -I 10 -W weka.classifiers.meta.MultiBoostAB

 

Correctly Classified Instances         526               70.1333 %

Incorrectly Classified Instances       224               29.8667 %

Kappa statistic                          0.001

Mean absolute error                      0.308

Root mean squared error                  0.4777

Relative absolute error                 73.675  %

Root relative squared error            104.5107 %

Total Number of Instances              750    

 

Total Number of Instances              750    

 

·        Συγκρίνοντας τα στατιστικά που μας δίνει το weka το πρώτο συμπέρασμα ήταν πως οι meta αλγόριθμοι έδιναν τα καλύτερα αποτελέσματα.

Για παράδειγμα

weka.classifiers.meta.Bagging

 

Correctly Classified Instances         551               73.4667 %

 

weka.classifiers.meta.Baggingweka.classifiers.meta.MultiClassClassifierWweka.classifiers.functions.Logistic

 

Correctly Classified Instances         554               73.8667 %

·        Στη συνέχεια έγινε εφαρμογή των αλγορίθμων που έδωσαν τα καλύτερα αποτελέσματα με supplies test set το δοσμένο test set.

·        Παρατηρήθηκε πως οι περισσότεροι meta αλγόριθμοι έδιναν prediction Correctly Classified Instances   100%, το οποίο μάλλον οφείλεται σε υπερπροσαρμογή.

·        Τελικά επιλέχθηκε η εφαρμογή ενός πιο από απλού αλγορίθμου

 

Scheme:       weka.classifiers.rules.DecisionTable -X 1 -S 5

 

Με cross validation

 

=== Stratified cross-validation ===

=== Summary ===

 

Correctly Classified Instances         540               72      %

Incorrectly Classified Instances       210               28      %

Kappa statistic                          0.2349

Mean absolute error                      0.3243

Root mean squared error                  0.4516

Relative absolute error                 77.5633 %

Root relative squared error             98.8021 %

Total Number of Instances              750    

 

 

Με supplied test set

=== Evaluation on test set ===

=== Summary ===

 

Correctly Classified Instances         201               80.4    %

Incorrectly Classified Instances        49               19.6    %

Kappa statistic                          0    

Mean absolute error                      0.2862

Root mean squared error                  0.41 

Relative absolute error                 96.0721 %

Root relative squared error            137.6539 %

Total Number of Instances              250    

 

 

Ζήτημα 2

  

 

v     Κανόνες που εξήχθησαν από τα ιστογράμματα του weka

ü      If  Pr.Axis.Rectangularity  >25,308 then class=bus

 

Επίοης για το Scaled Variance_Minor, ισχύει

 

ü      If  Variance_Minor>761.385 then class=bus

 

 

v     Κανόνες που εξήχθησαν με εφαρμογή του αλγορίθμου  rules.Part

 

 

  • Απλοί Κανόνες

PR.AXIS ASPECT RATIO <= 68 AND

MAX.LENGTH ASPECT RATIO <= 4: saab (7.0)

 

 

ELONGATEDNESS > 48: van (5.0)

 

 

 

ELONGATEDNESS <= 44 AND

PR.AXIS ASPECT RATIO <= 68: opel (5.0)

                 

PR.AXIS ASPECT RATIO > 65 AND

PR.AXIS ASPECT RATIO <= 70: van (4.0)

 

 

  • Από τους εξαγόμενους κανόνες ορισμένοι είναι  αξιόπιστοι.π.χ.

 

 

SCALED VARIANCE_MINOR > 309 AND

DISTANCE CIRCULARITY <= 76 AND

SKEWNESS ABOUT_MINOR <= 10 AND

SKEWNESS ABOUT_MAJOR > 64 AND

CIRCULARITY > 41: bus (107.0/1.0)

 

 

 

ELONGATEDNESS <= 41 AND

MAX.LENGTH ASPECT RATIO > 7 AND

SCALED VARIANCE_MINOR <= 721 AND

HOLLOWS RATIO <= 195 AND

MAX.LENGTH ASPECT RATIO > 8 AND

KURTOSIS ABOUT_MINOR > 185: opel (23.0)

 

 

  • Και κάποιοι αναξιόπιστοι:

 

PR.AXIS ASPECT RATIO <= 68 AND

RADIUS RATIO > 120 AND

SCALED VARIANCE_MAJOR <= 163: opel (39.0/18.0)

 

(λάθος 18 από τα 39)

 

 

ELONGATEDNESS <= 41 AND

MAX.LENGTH ASPECT RATIO > 7: opel (132.0/65.0)

 

(λάθος 65 από τα 132)

 

  • Με χρήση JRip

 

(ELONGATEDNESS >= 43) and (MAX.LENGTH ASPECT RATIO >= 9) and (DISTANCE CIRCULARITY >= 73) => Class=van

 

  

(MAX.LENGTH ASPECT RATIO >= 9) and (DISTANCE CIRCULARITY >= 100) and (SCALED VARIANCE_MAJOR <= 231) => Class=saab (71.0/9.0)

 

 

 

Advertisements

One response to “Τελική_Εξέταση:Ζαχαρίδου_Ηρώ

  1. Ζήτημα 1: Ολοκληρωμένη ανάπτυξη του θέματος, ωστόσο μη συμβατή με την υπόδειξη περιεχομένων και μορφής της. Τα ποσοστά σφάλματος με supplied test set δεν έχουν νόημα. Εκ του αποτελέσματος, η (μη) επιλογή χαρακτηριστικών αποδείχθηκε ημιτελής, επίσης η επιλογή μοναδικού βήματος απλο”ικού αλγορίθμου (ίσως θα έπρεπε να πειραματιστείς περισσότερο με μετα-αλγόριθμους. Εν τέλει, μέτριο ποσοστό σφάλματος.
    Ανάπτυξη: 6 / 10
    Αξιοπιστία προβλέψεων: 3 / 10
    Ζήτημα 2: Εξαιρετική η εξαγωγή ‘κανόνων’ απευθείας με οπτική ανάλυση. Οι απλοϊκοί κανόνες που αναφέρονται αρχικά έχουν χαμηλή κάλυψη, ενώ οι αναξιόπιστοι μάλλον δεν χρειάζονταν αναφορά. Θετική η χρήση περισσότεροων του ενός αλγορίθμων για την εξόρυξη μοτίβων. 8/10

    Σύνολο: 17/30

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s