About

Το παρόν αποτελεί το επίσημο blog του μαθήματος ‘Αλγόριθμοι Εξόρυξης Πληροφορίας’, το οποίο και διδάσκεται στο δεύτερο εξάμηνο του διατμηματικού μεταπτυχιακού προγράμματος σπουδών ‘Εφαρμοσμένες Μεταπτυχιακές Επιστήμες‘, με συντονίζουσα τη Σχολή Εφαρμοσμένων Μαθηματικών και Φυσικών Επιστημώντου Εθνικού Μετσόβιου Πολυτεχνείου. Το συγκεκριμένο μάθημα παρέχεται από τον Τομέα Βιομηχανικής Διοίκησης & Επιχειρησιακής Έρευνας της Σχολής Μηχανολόγων Μηχανικών ΕΜΠ, με υπεύθυνους τον καθηγητή κ. Ηλία Τατσιόπουλο και τον υπογράφοντα ΥΔ, Γεώργιο Τζιραλή. Οι διαλέξεις πραγματοποιούνται κάθε Τρίτη 12.00-14.00, στο pc-lab της ΣΕΜΦΕ.

Οι φοιτητές που παρακολουθούν το μάθημα είναι οι εξής (αλφαβητικά):

Τάξη 2009

Τάξη 2008

For a few words in english check this post.

4 responses to “About

  1. Απλά, ΚΑΤΑΠΛΗΚΤΙΚΗ ΙΔΕΑ !
    Συγχαρητήρια Γιώργο και σε όσους το σκεφτήκατε.

  2. Pingback: vrypan|net|weblog » Data Mining, a Course by Blog

  3. Γεια σε όλους,
    το όνομά μου είναι Χρήστος Μαλλιόπουλος, και είμαι φοιτητής του ΔΠΜΣ “Εφαρμοσμένες Μαθηματικές Επιστήμες”.
    Εργάζομαι στην COSMOTE όπου είμαι και υπεύθυνος για το Datamining στην Διεύθυνση Πληροφορικής. Η δουλειά μου επομένως συνδέεται άμεσα με το μάθημα.
    Παρακάτω, αναφέρω τρεις εφαρμογές μεθόδων και πρακτικών Datamining.

    1.
    Χαρακτηρισμός της συνδρομητικής βάσης παρόχου κινητής τηλεφωνίας.
    Πρόκειται για τυπική datamining εφαρμογή που ‘τρέχει’ εδώ και έναν περίπου χρόνο στην Cosmote και χαρακτηρίζει (classifies) τόσο τους πελάτες συμβολαίου όσο και τους καρτοκινητούς με βάση στοιχεία κλήσεων και δημογραφικά στοιχεία (όπου βεβαίως αυτό είναι δυνατόν). Για παν ενδεχόμενο αναφέρω εδώ ότι η εφαρμογή αξιολογεί αθροιστικά μόνον στοιχεία του πελατολογίου της εταιρίας και όχι ατομικά. Η κατηγοριοποίηση γίνεται σε πρώτη φάση με βάση τον τύπο των κλήσεων (εξερχόμενες και εισερχόμενες ανά δίκτυο προέλευσης και προορισμού, ώρες της ημέρας και ημέρες της εβδομάδας). Ακολουθεί standard PCA για την μείωση των διαστάσεων του προβλήματος και στο τέλος χρησιμοποιούνται τρεις (προς το παρόν) διαφορετικοί classifiers (Bayesian, k-means και linear regressors) συμπληρωματικά για την απόδοση κάθε συνδρομητή σε κάποια συνδρομητική κατηγορία.
    Απ’ ό,τι γνωρίζω αντίστοιχες προσεγγίσεις υπάρχουν και σε άλλους παρόχους (αν και γενικά το βάρος πεύτει περισσότερο σε αριθμητικούς υπολογισμούς ιστορικών στοιχείων και όχι στον στατιστικό και πληροφοριοθεωρητικό συμπερασμό).

    Συνεχίζω με δύο “πιο μοντέρνες” εφαρμογές που έχουμε ξεκινήσει πειραματικά:

    2.
    Social Network Analysis: στόχος εδώ είναι ο εντοπισμός κοινοτήτων συνδρομητών μέσω των γράφων αλληλεπίδρασης που δημιουργούν οι μεταξύ τους κλήσεις (ή των γράφων που δημιουργούνται από τα SMS και MMS).
    Το πρόβλημα είναι βασικά γραφοθεωρητικό με έντονο ερευνητικό ενδιαφέρον διεθνώς. Όποιος θέλει να μάθει περισσότερα ας ξεκινήσει από την wikipedia (social network theory, theory of weak-ties, Albert Lazlo Barabasi). Άρθρα περισσότερο τεχνικά μπορεί να βρει κανείς και στο arxiv αλλά νομίζω ότι τώρα πια υπάρχουν και αρκετά βιβλία.
    Όπως μπορεί εύκολα να φανταστεί κανείς, η θεωρία κοινωνικών δικτύων (περιλαμβάνοντας και τα scale-free nets του Barabasi) βρίσκεται στην βάση όλων των γνωστών δικτύων τύπου facebook, linkedIn κ.λπ.
    Δείτε επίσης και το site της IDIRO (http://www.idiro.com)

    3.
    Web mining: Η ιδέα εδώ είναι να έχουμε ένα σύνολο από crowlers που θ’ αναζητούν συγκεκριμένες πληροφορίες ή απλώς θα κάνουν κάποιο indexing σε αδόμητα σώματα κειμένων στο διαδίκτυο (από ηλεκτρονικό τύπο έως blog posts). Ασφαλώς μία τέτοια εφαρμογή θα πρέπει ν΄αξιοποιεί αρκετά καλά τεχνολογίες NLP (Natural Langiage Processing).

    Οι παραπάνω εφαρμογές δεν είναι ‘τυπικές’ datamining αλλά δείχνουν πιστεύω την δυναμική της περιοχής.

    Καλή αρχή σε όλους μας.

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s