Εργασία 03: Χουχούμης Ιωάννης

Δημιουργώντας τα ιστογράμματα συχνοτήτων των μεταβλητών παρατηρούμε ότι μπορούμε να διαγράψουμε το attribute 38 (χρησιμοποιώντας την εντολή Remove ή με το φίλτρο filters ->unsupervised ->attribute ->RemoveUseless) διότι σε αυτό το κάθε instance είναι ίσο με μηδέν,  επίσης  στα attributes 34, 36  έχουμε 2527 instances με τιμή 0 και ένα instance με τιμή 1 και 2513 instances με τιμή 0 και 15 instances με τιμή 1 αντίστοιχα, οπότε μπορούμε να διαγράψουμε και το attribute 34 και ίσως και το attribute 36 .

j11

j21

Επίσης από το tab  Select attributes επιλέγοντας Attribute Evaluator ->CfsSubsetEVal  και  Search Method-> GreedyStepwise έχουμε ένα σύνολο με 11 attributes απο τα 39

j31

ενώ επιλέγοντας Attribute Evaluator ->WrapperSubsetEval  και    Search Method->GeneticSearch παίρνουμε ένα σύνολο από μόνο 4 attributes

j41

Από τα ιστογράμματα παρατηρούμε επίσης ότι σε αρκετά attributes οι περισσότερες τιμές βρίσκονται κοντά στην ελάχιστη τιμή  οπότε θα μπορούσαμε με τη χρήση του φίλτρου filters ->unsupervised -> attribute ->Discretize να μετατρέψουμε κάποια attributes από αριθμητικά  σε ονομαστικά όπως π.χ. παρακάτω έχουμε μετατρέψει το attribute 36 από numeric σε nominal.

j5

Advertisements

2 responses to “Εργασία 03: Χουχούμης Ιωάννης

  1. Αλήθεια η RemoveUseless ποια attributes διέγραψε; Επίσης, η απομάκρυνση των τιμών outliers και στη συνέχεια η διακριτοποίηση θα είχε διαφορετικά (αν μη τι άλο ενδιαφέροντα) αποτελέσματα;
    Άριστα 5/5

  2. Ioannis Chouchoumis

    Η RemoveUseless διέγραψε μόνο το attribute 38.

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s