Εργασία 03:Παπαδημητρίου Παναγιώτης

Στο αρχικό dataset  παρατηρώντας τα διαγράμματα που προκύπτουν μπορούμε να βγάλουμε κάποια συμπεράσματα για τις μεταβλητές που επηράζουν την μεταβλητή στόχο.Έχουμε λοιπόν οτι οι τιμές της attr38 δεν επηρεάζουν την τιμή της μεταβλητής στόχο output.

erg3_6

Ακόμα παρατηρούμε ότι η μεταβλητή attr34 μπορεί να παραλειφθεί καθώς είναι φανερό από το παρακάτω γράφημα, ότι όλες οι τιμές για την output είναι συγκεντρωμένες σε ένα μικρό διάστημα τιμών της attr34

erg3_5

Στο ίδιο συμπέρασμα μπορούμε να καταλήξουμε μελετώντας τα διαγράμματα των μεταβλητών attr3, attr8, attr16, attr25, attr34. Οπότε χρησιμοποιώντας το φίλτρο remove μπορούμε να παραλείψουμε αυτές τις μεταβλητές και έτσι το αρχικό dataset έχει μείνει με 34 μεταβλητές. Σε αυτές τις μεταβλητές κάνουμε επιλογή με την μέθοδο best first και attribute evaluator το CfsSubsetEval και παρατηρούμε ότι δέκα από αυτές είναι σημαντικές (μεταβλητή στόχος είναι πάντα η output).

erg3_7

Στο ίδιο αποτέλεσμα καταλήγουμε αν επιλέξουμε την μέθοδο linear forward selection. Διαλέγοντας τώρα την greedy stepwise ή βάζοντας στην best first την επιλογή backwards, βλέπουμε ότι οι σημαντικές μεταβλητές είναι έντεκα αυτή την φορά.

erg3_8

Τέλος, παρατηρούμε ότι αν επιχειρήσουμε να διακριτοποιήσουμε τις 34 μεταβλητές μέσω του φίλτρου discretize, βάζοντας true στην επιλογή useEqualFrequency, και στην συνέχεια προσπαθήσουμε να κάνουμε επιλογή μεταβλητών μέσω της best first ή της  linear forward selection, τότε θα πάρουμε 14 μεταβλητές σαν σημαντικές.

erg3_13

erg3_122

Advertisements

One response to “Εργασία 03:Παπαδημητρίου Παναγιώτης

  1. Μου άρεσε η οπτική αιτιολόγηση για την απομάκρυνση της μεταβλητής, άριστα 5/5

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s