Πανδή Αθηνά Τελική Εξέταση

Ζήτημα 1

Δίνεται το αρχείο Creditdata trainset.arff” το οποίο περιέχει 750 υποδείγματα πελατών . Σαν μεταβλητή στόχος ορίζεται ο πιστωτικός κίνδυνος χορήγησης δανείου. Ζητείται η πρόγνωση πραγματικού επιπέδου πιστωτικού κινδύνου.

 

Τα βήματα που ακολουθήθηκαν είναι τα εξής.

 

  • Αρχικά με την εντολή visualize all παίρνουμε μία πρώτη εικόνα των δεδομένων όπου δεν μπορούμε να βγάλουμε σαφή εικόνα .

 

  • Προχωράμε σε attribute selection και εφαρμόζουμε διάφορες μεθόδους (π.χ chi square attribute selection) .

 

  • Αφαιρούμε τις μεταβλητές 5, 11, 16, 18.

 

  • Αποθηκεύουμε το νέο train set.

 

  • Τρέχουμε διάφορους αλγορίθμους .

 

  • Επιλέγουμε bagging->bagging->RepTree που μας δίνει Correctly Classified Instances  74.13%.

 

  • Αφαιρούμε και από το test set τις μεταβλητές 5, 11, 16, 18.

 

  •  Αποθηκεύουμε το test set με νέο όνομα, test 1.

 

  • Τρέχουμε ξανά  τον συνδυασμό που επιλέξαμε, αυτή τη φορά με supplied test set  το test1.

 

  • Αποθηκεύουμε τα predictions.

 

 Ζήτημα 2

 

Χρησιμοποιώντας τον αλγόριθμο PART εξάγονται τα παρακάτω patterns, όπου επιλέγουμε τις σχέσεις με βάση την απλότητα τους και το ποσοστό επιτυχίας.

 

  • ELONGATEDNESS <= 41 AND

      MAX.LENGTH ASPECT RATIO <= 7 AND

            COMPACTNESS > 95: bus (70.0/1.0)

 

  • MAX.LENGTH ASPECT RATIO > 8 AND

       HOLLOWS RATIO > 189 AND

       SKEWNESS ABOUT_MAJOR > 63: van (107.0/2.0)

 

 

  • SCALED VARIANCE_MINOR > 309 AND

      DISTANCE CIRCULARITY <= 76 AND

      SKEWNESS ABOUT_MINOR <= 10 AND

      SKEWNESS ABOUT_MAJOR > 64 AND

       CIRCULARITY > 41: bus (107.0/1.0)

 

Με τον αλγόριθμο Jrip εξάγουμε τα παρακάτω patters

 

  • (ELONGATEDNESS >= 43) and (MAX.LENGTH ASPECT RATIO >= 9) and (DISTANCE CIRCULARITY >= 73) => Class=van (86.0/0.0)

 

 

  • (MAX.LENGTH ASPECT RATIO >= 9) and (DISTANCE CIRCULARITY >= 100) and (SCALED VARIANCE_MAJOR <= 231) => Class=saab (71.0/9.0)

Advertisements

2 responses to “Πανδή Αθηνά Τελική Εξέταση

  1. Anna Skountzou

    Άριστα, 11/10!!!!
    :) :) :)

  2. Ζήτημα 1: Εξαιρετική ανάπτυξη του θέματος (αν και σε οριμένες περιπτώσεις δεν ικανοποίησες τον περιορισμό των 10 λέξεων ανά βήμα), σχετικά καλό ποσοστό σφάλματος.
    Ανάπτυξη: 10 / 10
    Αξιοπιστία προβλέψεων: 5 / 10
    Ζήτημα 2: Εξαιρετική και λιτή ανάπτυξη, 10 / 10

    Σύνολο: 25/30

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s