ΕΡΓΑΣΙΑ 03: Θεώνη Πετράτου

Η προεπεξεργασία και η επιλογή δεδομένων είναι πολύ χρήσιμη όταν έχουμε μια μεγάλη βάση δεδομένων, από την οποία θέλουμε να αντλήσουμε πληροφορίες για την επίλυση ενός προβλήματος. Για το σκοπό αυτό υπάρχουν πολλοί τρόποι που μας βοηθούν να μειώσουμε τον αριθμό των attributes ώστε η επεξεργασία των δεδομένων μας να είναι πιο εύκολη. Ορισμένοι από αυτούς τους τρόπους είναι οι ακόλουθοι:

  • Με τη βοήθεια της εντολής visualize all θα μας εμφανιστούν τα ιστογράμματα όλων των μεταβλητών και μπορούμε οπτικά να αποκλείσουμε κάποιες μεταβλητές. Για παράδειγμα, στο training set βλέπουμε ότι το attribute 38 μπορεί να εξαιρεθεί.
  • Πριν ξεκινήσουμε την ανάλυση είναι χρήσιμο να ελέγχουμε αν υπάρχουν missing values στο dataset μας. Το weka   μας παρέχει την δυνατότητα να αντικαταστήσουμε τις ελλειπούσες τιμές  με την εντολή replace missing values. Στο training set που έχουμε για ανάλυση δεν υπάρχουν missing values.
  • Στη συνέχεια μπορούμε να δούμε τις συχνότητες όλων των attributes και να αφαιρέσουμε αυτά που η συχνότητα τους είναι χαμηλή.
  • Επίσης σε ορισμένες περιπτώσεις είναι χρήσιμο  να μετατρέψουμε ορισμένες μεταβλητές από numeric σε nominal ώστε να είναι εφικτή η ανάλυση των δεδομένων.
  • Το weka διαθέτει πολλά φίλτρα που επιλέγουν αυτόματα τις μεταβλητές, αλλά επειδή υπάρχει ο κίνδυνος να εξαιρεθεί κάποια μεταβλητή που να είναι χρήσιμη θα πρέπει να εφαρμοσθούν πολλά φίλτρα για να καταλήξουμε σε μια απόφαση.
Advertisements

One response to “ΕΡΓΑΣΙΑ 03: Θεώνη Πετράτου

  1. Σωστά εν γένει τα σχόλια, αν και δεν κατανόησα πλήρως το bullet 3, επίσης η ανάλυση 8α μπορούσε να ήταν περισσότερο πλήρης. Σε συνδυασμό ωστόσο με την ασάφεια της διάλεξης και εκφώνησης της εργασίας, η βαθμολογία που λαμβάνεις είναι 5/5.

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s