απορία για 04

Στην προηγούμενη εργασία μου, είχα μετατρέψει την target attribute (output) σε nominal. Προσπάθησα λοιπόν να κάνω το ίδιο στο train.arff αυτής της εργασίας και στη συνέχεια  έκανα nominal και την output του quiz.arff, αφού πρώτα την προσέθεσα. Όταν όμως ξανάνοιξα το train.arff για να πάω στην επιλογή Classify>Test Options>Select Test Set–>Set–>Open File –>quiz.arff (δηλαδή ακολουθώντας τη διαδικασία αυτή ανοίγω το quiz.arff που είχα αποθηκεύσει προηγουμένως με κάποιο όνομα) κι επειδή είναι nominal τώρα η output διαλέγω ως classifier τον OneR, μου λέει ότι το train και το test set (δηλαδή το quiz στην προκειμένη περίπτωση) δεν είναι συμβατά. Επίσης, έχω προσπαθήσει να κάνω nominal όλα τα attributes καθώς και όλα τα attributes εκτός του output. Μου εμφανίζει όμως ακριβώς το ίδιο μήνυμα. Τι κάνω λάθος ???

Advertisements

11 responses to “απορία για 04

  1. Είναι και τα δύο set απόλυτα συμβατά (δλδ ίδιος αριθμός attributes, ίδια χαρακτηριστικά του κάθε attribute, πχ nominal/numeric κτλ); Με άλλα λόγια, έχετε εφαρμόσει τα ίδια βήματα preprocessing και στα δύο σύνολα;

  2. Ίδιος αριθμός attributes, ίδια χαρακτηριστικά του κάθε attribute και γενικότερα ίδια βήματα preprocessing και στα δύο σύνολα!!! Όλα τα έχω κάνει…..Προσπαθώ από χθές και δεν πετυχαίνει………. :(

  3. giorgos moutsatsos

    Όντως και σε εμένα συμβαίνει αυτο…
    Έχω κάνει ακριβώς τα ίδια και στα δύο dataset έχω προσέξει πολύ ώστε να έχουν ακριβώς τα ίδια χαρακτιριστηκά όλα τα attributes και όμως παρόλα αυτά δεν είναι συμβατα :(

  4. Το κοίταξες και αυτό, σωστά; https://dataminingntua.wordpress.com/2008/04/08/on-subject/

    Χρησιμοποίησε το quiz_extended.arff καλύτερα.. & πες μου αν είναι ok :)

  5. giorgos moutsatsos

    Δυστυχώς ακόμα και με το quiz_extended.arff το ίδιο μου σύμβαίνει :(
    Έχω προσέξει όλες τις λεπτομέρειες και όμως εξακολουθεί να ισχύει η μη συμβατότητα, δεν μπορώ να καταλάβω που οφείλεται. :(

  6. Αν δοκιμάσετε χωρίς καθόλου preprocessing, νομίζω αυτά δουλεύουν κανονικά. Με το preprocessing όμως, σας βγάζει το συγκεκριμένο μύνημα, πράγμα που σαφώς υποδηλώνει ότι υπάρχει κάποια αναντοιστοιχία της διαδικασίας.

    Η απαιτούμενη απόλυτη συμβατότητα περιλαμβάνει ακόμα και τον αριθμό διαστημάτων κατά το discretization, νομίζω ακόμα και τα όρια των διαστημάτων αυτών (για παράδειγμα δεν μπορείτε να κάνετε unsupervised discretization στο train, πχ με equal frequencies, μετά unsupervised discretization και στο quiz, προκύπτουν ασυμβατότητες.

    Περισσότερο περιγραφικά, θα έλεγα ότι η διαδικασία περιλαμβάνει αντίστοιχα εκνευριστικό βαθμό τυπικότητας με τη δημιουργία arff, οπότε στα πλαίσια της παρούσας εργασίας θα πρότεινα να περιορίσετε στο ελάχιστο την προεπεξεργασία, και απλά να βγάλετε κάποια αποτελέσματα στο quiz, χωρίς να ενδιαφέρει πολύ η έκταση του σφάλματος.

  7. giorgos moutsatsos

    Έχω προβεί σε μία πρόβλεψη όμως είναι όλα τα attributes και το output numeric έχω προσπαθήσει αρκετούς συνδιασμούς με numeric και καταλήγω στην ίδια πρόβλεψη :(
    Ψάχνω εδω και τρείς μέρες να βρώ μία επιπλέον πρόβλεψη αλλά αντιμετωπίζω το προβλημα της ασυμβατότητας εάν έχω έστω και ένα nominal attribute

  8. Δοκίμασα (χωρίς ΚΑΘΟΛΟΥ preprocessing) να κάνω όλα τα παραπάνω στο segment-challenge/segment-test, που είναι έτοιμα στο weka και επίσης έχουν nominal μεταβλητή στόχο. Πράγματι, λειτούργησε!!! Μένει να λειτουργήσει και στο δικό μας πρόβλημα τώρα…….. :s Όσο για τα numeric μια χαρά, αλλά όντως πολύ περιορισμένος ο αριθμός των προβλέψεων…..

  9. Στο segment challenge/test, τρέχει κανονικά ακόμα και αν κάνω preprocessing……μόλις το δοκίμασα.Η μόνη διαφορά με το δικό μας πρόβλημα είναι ότι η target attribute είναι nominal ήδη. Μήπως φταίει αυτό τελικά? Μήπως η μη συμβατότητα προκύπτει επειδή μετατρέπουμε την target attribute σε nominal??? ….Προσωπικά στις προσπάθειές μου, ακολουθώ Α-Κ-Ρ-Ι-Β-Ω-Σ την ίδια διαδικασία κατά τη μετατροπή αυτή και στα δύο σετ….

  10. Δε θυμάμαι ακριβώς τη διαδικασία και τις λεπτομέρειες της μετατροπής numeric σε nominal, μήπως τα όρια διακριτοποίησης δεν είναι ίδια σε σε train & quiz set; Ίσως με supervised discretization στο quiz γίνει στοχευμένη και όμοια διακριτοποίηση και αποφευχθούν τα προβλήματα.

  11. εγώ δουλεύω με αρχείο που έχει όλες τις μετ/τες numeric κ δεν έχει υποστεί προεπεξεργασία κ πάλι δεν μου τρέχει η εντολή…..βγάζει μήνυμα για μη συμβατότητα…

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s