Μάθημα: Βάσεις Δεδομένων και Παγκόσμιος Ιστός
Διδάσκων: Γιάννης Σταύρακας (ys@inf.uth.gr)
Γραφείο: Δ3-4, 4ος
όροφος, Γκλαβάνη 37
Περιγραφή μαθήματος
Ο
Παγκόσμιος Ιστός μπορεί να ιδωθεί σαν μια τεράστια Βάση Δεδομένων. Έτσι, είναι
δυνατόν να χρησιμοποιηθούν τεχνικές των Βάσεων Δεδομένων για την διαχείριση
πληροφορίας στον Ιστό. Το μάθημα εστιάζει στα σημεία όπου συναντιούνται οι δυο
τεχνολογίες: αυτές των Βάσεων Δεδομένων και του Ιστού. Συγκεκριμένα, μετά από
μια σύντομη εισαγωγή σε έννοιες των Βάσεων Δεδομένων και του Ιστού, εξετάζονται
τα εξής θέματα: Information Retrieval και μηχανές αναζήτησης, αρχιτεκτονικές
και τεχνολογίες ανάπτυξης data-intensive
εφαρμογών στο Διαδύκτιο, mediators και wrappers, ολοκλήρωση πληροφορίας από
ετερογενείς πηγές, ημιδομημένα δεδομένα και γλώσσες ερωτημάτων για τον Ιστό,
XML, σχεδιασμός και διαχείριση Web
sites με χρήση τεχνικών Βάσεων Δεδομένων, ανοικτά ερευνητικά προβλήματα.
Δομή μαθήματος
Εισαγωγικά:
·
Ανασκόπηση των Βάσεων Δεδομένων
·
Βασικές έννοιες του Ιστού
Τεχνολογίες
ΒΔ στις εφαρμογές του Ιστού:
·
Information Retrieval και μηχανές αναζήτησης
·
Αρχιτεκτονικές και παραδείγματα
εφαρμογών του Ιστού που χρησιμοποιούν ΒΔ
·
Τεχνολογίες ανάπτυξης data-intensive εφαρμογών
·
Mediators και wrappers
Ερευνητικές
κατευθύνσεις:
·
Ολοκλήρωση πληροφορίας από
ετερογενείς πηγές
·
Ημιδομημένα δεδομένα και γλώσσες
ερωτημάτων για τον Ιστό
·
XML και σχετικές τεχνολογίες
·
Σχεδιασμός τόπων του Ιστού με
μεθοδολογίες ΒΔ
·
Ανοιχτά ερευνητικά θέματα. . .
Εργασίες
Λεπτομέρειες για το προγραμματιστικό project εδώ.
· Διαχείριση αλλαγών σε βάσεις ημιδομημένων δεδομένων
· Μέθοδοι αποθήκευσης ΧΜL πληροφορίας
·
Active XML
· Semantic Web, RDF, OWL
·
Web services
·
XML query optimization
· Personalization πληροφορίας στον Ιστό
·
Caching web data
·
. . .
Λεπτομέρειες για βιβλιογραφική εργασία εδώ.
Βαθμολογία
- Το άριστα στις γραπτές εξετάσεις είναι 4.
- Το άριστα στην προγραμματιστική εργασία είναι 3.
- Το άριστα στην βιβλιογραφική εργασία είναι 3.
Οι δύο εργασίες είναι υποχρεωτικές, και θα πρέπει να
περάσετε ξεχωριστά καθένα από τα τρία παραπάνω μέρη.
Βιβλία
Κάποιες επιπλέον σχετικές δημοσιεύσεις
Αλλα βιβλία για Βάσεις Δεδομένων:
Πηγές
- Java, HTML: υπάρχει πληθώρα υλικού στον ιστό για HTML, καθώς και online βιβλία για Java (πχ. Java Tutorial).
- Δημοσιεύσεις: μια πολύ καλή πηγή για εργασίες στην περιοχή των βάσεων δεδομένων είναι το DΒLP.
- W3C: The World Wide Web Consortium
Διαφάνειες διαλέξεων
Δ2: >>
Δ5: >>
Δ6: Data-intensive εφαρμογές στον Ιστό
Δ7: >>
Δ9: Ολοκλήρωση ετερογενούς πληροφορίας
Δ10: Ημιδομημένα δεδομένα
Δ11: Τεχνολογίες XML
Παρουσιάσεις εργασιών (διαφάνειες και κείμενα)
Δ12: Personalization
Δ13: Μελλοντική έρευνα
Υλη Εξετάσεων
- Ολες οι διαφάνειες των διαλέξεων Δ1-Δ11
- Από το κεφάλαιο 27 «Information Retrieval and XML Data» του βιβλίου «Database Management Systems», από την αρχή έως και την ενότητα 27.7.4
- Από το κεφάλαιο 7 «Internet Applications» του βιβλίου «Database Management Systems», από την αρχή έως και την ενότητα 7.7.5
- Από το κεφάλαιο 6 «Database Application Development» του βιβλίου «Database Management Systems», από την ενότητα 6.2 έως και την ενότητα 6.5.2
-
Η εργασία «Jeffrey Ullman. Information
Integration Using Logical Views. In 6th International Conference
on Database Theory (ICDT’97),
-
Tο κεφάλαιο 1 «Introduction» του βιβλίου «Data on the Web».
- Από το κεφάλαιο 2 «A Syntax for Data» του βιβλίου «Data on the Web», από την αρχή έως και την ενότητα 2.6
- Από το κεφάλαιο 3 «XML» του βιβλίου «Data on the Web», από την αρχή έως και την ενότητα 3.3.6
- Από το κεφάλαιο 4 «Query Languages» του βιβλίου «Data on the Web», από την αρχή έως και την ενότητα 4.5.1
-
Tο κεφάλαιο 5 «Query Languages for XML» του βιβλίου «Data on the Web».
- Ολες οι διαφάνειες καθώς και τα αντίστοιχα κείμενα των βιβλιογραφικών εργασιών (Δ12 και Δ13).