Τμήμα Μηχανικών Η/Υ, Τηλεπικοινωνιών και Δικτύων
Πανεπιστήμιο Θεσσαλίας

 

Η/Υ 452 - Μοντελοποίηση, Ανάκληση Πληροφορίας και Εξόρυξη Γνώσεως
  Χειμερινό Εξάμηνο 2009 - 2010

 

 

Διδάσκων:                   Βασίλειος Σ. Βερύκιος
Γραφείο:                     Ε2/6
Τηλέφωνο:                  24210 - 74940
Ιστοσελίδα:                 www.inf.uth.gr/~verykios

Ιστοσελίδα DMPG: http://dmpg.inf.uth.gr

E-mail:                        verykios@inf.uth.gr

 

Ώρες διδασκαλίας:     Τρίτη 17:00 - 19:00  &  Τετάρτη 10:00 - 12:00


Σύγγραμμα

Εισαγωγή στην Εξόρυξη Δεδομένων. P.N. Tan, M. Steinbach, and V. Kumar. Εκδόσεις ΤΖΙΟΛΑΣ, 2009.

 

Εισαγωγικά και Προηγμένα Θέματα Εξόρυξης Γνώσης από Δεδομένα Margaret H. Dunham, (Επιμέλεια Ελληνικής Έκδοσης: Βασίλης Βερύκιος και Γιάννης Θεοδωρίδης) Εκδόσεις Νέων Τεχνολογιών, ISBN 960-8105-72-2

 

Διαφάνειες

  1. Εισαγωγή
  2. Εισαγωγή - Δεδομένα
  3. Τεχνικές Εξόρυξης Γνώσης
  4. Κατηγοριοποίηση - Πρώτο μέρος (Γενικά, Παλινδρόμηση, Κανόνας του Bayes)
  5. Κατηγοριοποίηση - Δεύτερο μέρος (Κατηγοριοποίηση με απόσταση, Δέντρα απόφασης, Νευρωνικά Δίκτυα)
  6. Κανόνες συσχέτισης (Δείτε επίσης: Agrawal, Srikant VLDB’94, διαφάνειες για Apriori hash)
  7. Συσταδοποίηση
  8. Εισαγωγή στο WEKA (Δείτε επίσης: http://www.cs.waikato.ac.nz/ml/weka/)
    1. WEKA Experimenter Tutorial
    2. WEKA Explorer User Guide
    3. WEKA Bayesian Net Classifiers
  1. Αξιοπιστία
  2. Εξόρυξη χρονικής γνώσης

 

Διαδικαστικά Θέματα

  1. Ο τελικός βαθμός του μαθήματος καθορίζεται αποκλειστικά από το τελικό διαγώνισμα. Δε θα ανατεθούν εργασίες και δε θα πραγματοποιηθεί πρόοδος.
  2. Για ότι χρειάζεστε για το μάθημα σας παρακαλώ πολύ να έρχεστε στο γραφείο μου κατά την διάρκεια των ωρών γραφείου που αναφέρονται παραπάνω. Επιπλέον, για οτιδήποτε χρειαστείτε από το βοηθό του μαθήματος, παρακαλείστε να επικοινωνήσετε αρχικά μαζί του μέσω email προκειμένου να οριστεί συνάντηση.
  3. Εάν χρειάζεται να επικοινωνήσετε μαζί μου ηλεκτρονικά, σας παρακαλώ πολύ να αρχίζετε το Subject του μηνύματός σας με το κείμενο που υπάρχει μέσα στα διπλά αποσιωπητικά "[C452]".

 


Βιβλιογραφία

  1. Data Mining: Concepts and Techniques, Jiawei Han and Micheline Kamber, Morgan Kaufmann Publishers, 2000.
  2. Data Mining: Introductory and Advanced Topics, Margaret H. Dunham, Prentice Hall, 2003.
  3. Data Mining: Practical Machine Learning Tools and Techniques with JAVA Implementations, Ian H. Witten and Eibe Frank, Morgan Kaufmann Publishers, 2000.
  4. Θεμελιώδεις Αρχές Συστημάτων Βάσεων Δεδομένων, R. Elmasri και S.B. Navathe, Μετάφραση Μ. Χατζόπουλου Τόμος Α' και Β'.
  5. Introduction to Data Mining, M. Steinbach, P. N. Tan, V. Kumar, Addison-Wesley, April 2005

 

Ενδιαφέροντα Επιστημονικά Άρθρα

  1. An Overview of Data Warehousing and OLAP Technology. Surajit Chaudhuri and Umeshwar Dayal, SIGMOD Record 26(1): 65-74 (1997)
  2. SLIQ: A Fast Scalable Classifier for Data Mining, Manish Mehta, Rakesh Agrawal, Jorma Rissanen. EDBT 1996 18-32
  3. SPRINT: A Scalable Parallel Classifier for Data Mining. John C. Shafer, Rakesh Agrawal, Manish Mehta.  VLDB 1996: 544-555
  4. PUBLIC: A Decision Tree Classifier that Integrates Building and Pruning. Rajeev Rastogi, Kyuseok Shim.VLDB 1998: 404-415
  5. RainForest - A Framework for Fast Decision Tree Construction of Large Datasets. Johannes Gehrke, Raghu Ramakrishnan, Venkatesh Ganti. VLDB 1998: 416-427
  6. MAFIA: A Maximal Frequent Itemset Algorithm for Transactional Databases. Douglas Burdick, Manuel Calimlim, Johannes Gehrke. ICDE 2001: 443-452
  7. Sampling Large Databases for Association Rules. Hannu ToivonenVLDB 1996: 134-145
  8. Fast Algorithms for Mining Association Rules in Large Databases. Rakesh Agrawal, Ramakrishnan Srikant:  VLDB 1994: 487-499
  9. Fast Discovery of Association Rules. Rakesh Agrawal, Heikki Mannila, Ramakrishnan Srikant, Hannu Toivonen, A. Inkeri VerkamoAdvances in Knowledge Discovery and Data Mining 1996: 307-328
  10. Beyond Market Baskets: Generalizing Association Rules to Correlations. S. Brin, R. Motwani, and C. SilversteinACM SIGMOD 1997: 265-276

 

Μάθημα Εξόρυξης Δεδομένων σε Άλλα Ελληνικά Πανεπιστήμια

  1. Αποθήκες Δεδομένων και Εξόρυξη Γνώσης - Πανεπιστήμιο Πειραιώς
  2. Αλγόριθμοι Εξόρυξης Δεδομένων - Εθνικό Μετσόβιο Πολυτεχνείο

 

Διπλωματικές Εργασίες και Ειδικά Θέματα

Το ακόλουθο link παρέχει ένα πλήθος από προσφερόμενες διπλωματικές εργασίες και ειδικά θέματα πάνω στο αντικείμενο των ΒΔ και της εξόρυξης γνώσης.

 

Ενδιαφέρουσες Ιστοσελίδες

  1. KDnuggets: Data Mining, Web Mining, and Knowledge Discovery Guide
  2. MLnet OiS The Machine Learning network, Online information System
  3. ACM Special Interest Group on Knowledge Discovery in Data and Data Mining
  4. ACM Special Interest Group on Information Retrieval
  5. UCI KDD Archive