Data Mining, a Course by Blog

About

Το παρόν αποτελεί το επίσημο blog του μαθήματος ‘Αλγόριθμοι Εξόρυξης Πληροφορίας’, το οποίο και διδάσκεται στο δεύτερο εξάμηνο του διατμηματικού μεταπτυχιακού προγράμματος σπουδών ‘Εφαρμοσμένες Μεταπτυχιακές Επιστήμες‘, με συντονίζουσα τη Σχολή Εφαρμοσμένων Μαθηματικών και Φυσικών Επιστημώντου Εθνικού Μετσόβιου Πολυτεχνείου. Το συγκεκριμένο μάθημα παρέχεται από τον Τομέα Βιομηχανικής Διοίκησης & Επιχειρησιακής Έρευνας της Σχολής Μηχανολόγων Μηχανικών ΕΜΠ, με υπεύθυνους τον καθηγητή κ. Ηλία Τατσιόπουλο και τον υπογράφοντα ΥΔ, Γεώργιο Τζιραλή. Οι διαλέξεις πραγματοποιούνται κάθε Τρίτη 12.00-14.00, στο pc-lab της ΣΕΜΦΕ.

Οι φοιτητές που παρακολουθούν το μάθημα είναι οι εξής (αλφαβητικά):

Τάξη 2009

Τάξη 2008

For a few words in english check this post.

4 Comments

4 responses so far ↓

  • Panos // March 20, 2008 at 10:46 am | Reply

    Απλά, ΚΑΤΑΠΛΗΚΤΙΚΗ ΙΔΕΑ !
    Συγχαρητήρια Γιώργο και σε όσους το σκεφτήκατε.

  • Σπύρος Ντόβας // March 20, 2008 at 11:34 am | Reply

    thumbs up!

  • vrypan|net|weblog » Data Mining, a Course by Blog // March 20, 2008 at 8:39 pm | Reply

    [...] Data Mining, a Course by Blog: το blog του μαθήματος “Αλγόριθμοι Εξόρυξης Πληροφορίας”, αποτελεί εξαιρετικό μάθημα για το πώς η εκπαιδευτική διαδικασία και η ακαδημαϊκή κοινότητα μπορεί να ξεφύγει από την εσωστρέφεια που την χαρακτηρίζει στην Ελλάδα. (μπράβο, gtzi) This entry was written by Panayotis, posted on 20|Mar|2008 at 20:39, filed under asides. Bookmark the permalink. Follow any comments here with the RSS feed for this post. Post a comment or leave a trackback: Trackback URL. [...]

  • cmalliopoulos // March 9, 2009 at 11:36 pm | Reply

    Γεια σε όλους,
    το όνομά μου είναι Χρήστος Μαλλιόπουλος, και είμαι φοιτητής του ΔΠΜΣ “Εφαρμοσμένες Μαθηματικές Επιστήμες”.
    Εργάζομαι στην COSMOTE όπου είμαι και υπεύθυνος για το Datamining στην Διεύθυνση Πληροφορικής. Η δουλειά μου επομένως συνδέεται άμεσα με το μάθημα.
    Παρακάτω, αναφέρω τρεις εφαρμογές μεθόδων και πρακτικών Datamining.

    1.
    Χαρακτηρισμός της συνδρομητικής βάσης παρόχου κινητής τηλεφωνίας.
    Πρόκειται για τυπική datamining εφαρμογή που ‘τρέχει’ εδώ και έναν περίπου χρόνο στην Cosmote και χαρακτηρίζει (classifies) τόσο τους πελάτες συμβολαίου όσο και τους καρτοκινητούς με βάση στοιχεία κλήσεων και δημογραφικά στοιχεία (όπου βεβαίως αυτό είναι δυνατόν). Για παν ενδεχόμενο αναφέρω εδώ ότι η εφαρμογή αξιολογεί αθροιστικά μόνον στοιχεία του πελατολογίου της εταιρίας και όχι ατομικά. Η κατηγοριοποίηση γίνεται σε πρώτη φάση με βάση τον τύπο των κλήσεων (εξερχόμενες και εισερχόμενες ανά δίκτυο προέλευσης και προορισμού, ώρες της ημέρας και ημέρες της εβδομάδας). Ακολουθεί standard PCA για την μείωση των διαστάσεων του προβλήματος και στο τέλος χρησιμοποιούνται τρεις (προς το παρόν) διαφορετικοί classifiers (Bayesian, k-means και linear regressors) συμπληρωματικά για την απόδοση κάθε συνδρομητή σε κάποια συνδρομητική κατηγορία.
    Απ’ ό,τι γνωρίζω αντίστοιχες προσεγγίσεις υπάρχουν και σε άλλους παρόχους (αν και γενικά το βάρος πεύτει περισσότερο σε αριθμητικούς υπολογισμούς ιστορικών στοιχείων και όχι στον στατιστικό και πληροφοριοθεωρητικό συμπερασμό).

    Συνεχίζω με δύο “πιο μοντέρνες” εφαρμογές που έχουμε ξεκινήσει πειραματικά:

    2.
    Social Network Analysis: στόχος εδώ είναι ο εντοπισμός κοινοτήτων συνδρομητών μέσω των γράφων αλληλεπίδρασης που δημιουργούν οι μεταξύ τους κλήσεις (ή των γράφων που δημιουργούνται από τα SMS και MMS).
    Το πρόβλημα είναι βασικά γραφοθεωρητικό με έντονο ερευνητικό ενδιαφέρον διεθνώς. Όποιος θέλει να μάθει περισσότερα ας ξεκινήσει από την wikipedia (social network theory, theory of weak-ties, Albert Lazlo Barabasi). Άρθρα περισσότερο τεχνικά μπορεί να βρει κανείς και στο arxiv αλλά νομίζω ότι τώρα πια υπάρχουν και αρκετά βιβλία.
    Όπως μπορεί εύκολα να φανταστεί κανείς, η θεωρία κοινωνικών δικτύων (περιλαμβάνοντας και τα scale-free nets του Barabasi) βρίσκεται στην βάση όλων των γνωστών δικτύων τύπου facebook, linkedIn κ.λπ.
    Δείτε επίσης και το site της IDIRO (http://www.idiro.com)

    3.
    Web mining: Η ιδέα εδώ είναι να έχουμε ένα σύνολο από crowlers που θ’ αναζητούν συγκεκριμένες πληροφορίες ή απλώς θα κάνουν κάποιο indexing σε αδόμητα σώματα κειμένων στο διαδίκτυο (από ηλεκτρονικό τύπο έως blog posts). Ασφαλώς μία τέτοια εφαρμογή θα πρέπει ν΄αξιοποιεί αρκετά καλά τεχνολογίες NLP (Natural Langiage Processing).

    Οι παραπάνω εφαρμογές δεν είναι ‘τυπικές’ datamining αλλά δείχνουν πιστεύω την δυναμική της περιοχής.

    Καλή αρχή σε όλους μας.

Leave a Comment