Data Mining, a Course by Blog

ΕΡΩΤΗΣΗ

April 11, 2008 · 1 Comment

Αφορά την εργασία 04. Δικαιολογείται το train set μετά την εφαρμογή κάποιων αλγορίθμων (με cross validation) να δίνει πολύ χαμηλό σφάλμα και καλό correlation και η εφαρμογή των ίδιων διαδικασιών με supplied test set το αντίστοιχο quiz να δίνει εντελώς χάλια σφάλματα??? Έχει σχέση με το ότι η προστιθέμενη τελευταία στήλη των outputs στο quiz είναι όλα μηδεν? Αν ναι πρέπει να βάλουμε δικά μας νούμερα στην τύχη?

Categories: ερωτήσεις

1 response so far ↓

  • George Tziralis // April 12, 2008 at 11:08 am

    Μην σας απασχολεί το error στο quiz set. Εξάλλου, έχουμε βάλει σε κάθε instance την ίδια τιμή (0), είναι αναμενόμενο το error rate να είναι υπερμεγέθες.

    Ζητούμενο του τρεξίματος στο quiz set είναι να εξάγετε τα predictions του βελτιστοποιημένου στο training set αλγορίθμου και να μου τα στείλετε σε ένα .txt για να σας δώσω εγώ το πραγματικό σφάλμα.

Leave a Comment