Μάθημα: Βάσεις Δεδομένων και Παγκόσμιος Ιστός

Διδάσκων: Γιάννης Σταύρακας (ys@inf.uth.gr)

Γραφείο: Δ3-4, 4ος όροφος, Γκλαβάνη 37

Περιγραφή μαθήματος

Ο Παγκόσμιος Ιστός μπορεί να ιδωθεί σαν μια τεράστια Βάση Δεδομένων. Έτσι, είναι δυνατόν να χρησιμοποιηθούν τεχνικές των Βάσεων Δεδομένων για την διαχείριση πληροφορίας στον Ιστό. Το μάθημα εστιάζει στα σημεία όπου συναντιούνται οι δυο τεχνολογίες: αυτές των Βάσεων Δεδομένων και του Ιστού. Συγκεκριμένα, μετά από μια σύντομη εισαγωγή σε έννοιες των Βάσεων Δεδομένων και του Ιστού, εξετάζονται τα εξής θέματα: Information Retrieval και μηχανές αναζήτησης, αρχιτεκτονικές και τεχνολογίες ανάπτυξης data-intensive εφαρμογών στο Διαδύκτιο, mediators και wrappers, ολοκλήρωση πληροφορίας από ετερογενείς πηγές, ημιδομημένα δεδομένα και γλώσσες ερωτημάτων για τον Ιστό, XML, σχεδιασμός και διαχείριση Web sites με χρήση τεχνικών Βάσεων Δεδομένων, ανοικτά ερευνητικά προβλήματα.

Στοιχεία για το μάθημα

Δομή μαθήματος

 

Εισαγωγικά:

·         Ανασκόπηση των Βάσεων Δεδομένων

·         Βασικές έννοιες του Ιστού

Τεχνολογίες ΒΔ στις εφαρμογές του Ιστού:

·         Information Retrieval και μηχανές αναζήτησης

·         Αρχιτεκτονικές και παραδείγματα εφαρμογών του Ιστού που χρησιμοποιούν ΒΔ

·         Τεχνολογίες ανάπτυξης data-intensive εφαρμογών

·         Mediators και wrappers

Ερευνητικές κατευθύνσεις:

·         Ολοκλήρωση πληροφορίας από ετερογενείς πηγές

·         Ημιδομημένα δεδομένα και γλώσσες ερωτημάτων για τον Ιστό

·         XML και σχετικές τεχνολογίες

·         Σχεδιασμός τόπων του Ιστού με μεθοδολογίες ΒΔ

·         Ανοιχτά ερευνητικά θέματα. . .

 

Εργασίες

 

  1. Προγραμματιστικό project: Καθένας θα πρέπει να ολοκληρώσει ένα πρόγραμμα σε Java που θα αποσπά συγκεκριμένα στοιχεία από HTML σελίδες του Ιστού και θα τα εισάγει σε μια απλή βάση MS-Access.

Λεπτομέρειες για το προγραμματιστικό project εδώ.

 

  1. Βιβλιογραφική εργασία: Ανά δύο άτομα θα πρέπει να επιλέξετε μια ερευνητική περιοχή που σας ενδιαφέρει, να μελετήσετε μερικές σχετικές εργασίες, και να ετοιμάσετε μια παρουσίαση διάρκειας περίπου 25 λεπτών. Οι παρουσιάσεις θα γίνουν στα δύο τελευταία μαθήματα. Ενδεικτικά θέματα αναφέρονται στην συνέχεια, άλλες προτάσεις ευπρόσδεκτες.

·        Διαχείριση αλλαγών σε βάσεις ημιδομημένων δεδομένων

·        Μέθοδοι αποθήκευσης ΧΜL πληροφορίας

·        Active XML

·        Semantic Web, RDF, OWL

·        Web services

·        XML query optimization

·        Personalization πληροφορίας στον Ιστό

·        Caching web data

·        . . .

Λεπτομέρειες για βιβλιογραφική εργασία εδώ.

 

Βαθμολογία

 

- Το άριστα στις γραπτές εξετάσεις είναι 4.

- Το άριστα στην προγραμματιστική εργασία είναι 3.

- Το άριστα στην βιβλιογραφική εργασία είναι 3.

Οι δύο εργασίες είναι υποχρεωτικές, και θα πρέπει να περάσετε ξεχωριστά καθένα από τα τρία παραπάνω μέρη.

Βιβλία

  • Data on the Web: From Relations to Semistructured Data and XML. Serge Abiteboul, Peter Buneman, Dan Suciu. Εκδόσεις Morgan Kaufmann, 2000.
  • Database Management Systems. Ramakrishnan, Gehrke. Εκδόσεις McGraw-Hill, 2003. (Υπάρχει και σε Ελληνική έκδοση)

Κάποιες επιπλέον σχετικές δημοσιεύσεις

 

Αλλα βιβλία για Βάσεις Δεδομένων:

  • Θεμελιώδεις Αρχές Συστημάτων Βάσεων Δεδομένων. R. Elmasri, S.B.Navathe. Εκδόσεις ΔΙΑΥΛΟΣ, 2001.
  • Εισαγωγή στα Συστήματα Βάσεων Δεδομένων. C.J.Date. Εκδόσεις Κλειδάριθμος.

 

Πηγές

 

- Java, HTML: υπάρχει πληθώρα υλικού στον ιστό για HTML, καθώς και online βιβλία για Java (πχ. Java Tutorial).

- Δημοσιεύσεις: μια πολύ καλή πηγή για εργασίες στην περιοχή των βάσεων δεδομένων είναι το DΒLP.

- W3C: The World Wide Web Consortium

 

Διαφάνειες διαλέξεων

 

Δ1:       Εισαγωγικά στοιχεία ΒΔ

Δ2:                   >>

Δ3:       Βασικές έννοιες του Ιστού

Δ4:       IR και Μηχανές αναζήτησης

Δ5:                   >>

Δ6:       Data-intensive εφαρμογές στον Ιστό

Δ7:                   >>

Δ8:       Mediators και Wrappers

Δ9:       Ολοκλήρωση ετερογενούς πληροφορίας

Δ10:     Ημιδομημένα δεδομένα

Δ11:     Τεχνολογίες XML

 

Παρουσιάσεις εργασιών (διαφάνειες και κείμενα)

 

Δ12:     Personalization

            Semantic Web

            Web Services

Δ13:     Μελλοντική έρευνα

            Active XML

            Μέθοδοι αποθήκευσης XML

 

Υλη Εξετάσεων

 

-         Ολες οι διαφάνειες των διαλέξεων Δ1-Δ11

-         Από το κεφάλαιο 27 «Information Retrieval and XML Data» του βιβλίου «Database Management Systems», από την αρχή έως και την ενότητα 27.7.4

-         Από το κεφάλαιο 7 «Internet Applications» του βιβλίου «Database Management Systems», από την αρχή έως και την ενότητα 7.7.5

-         Από το κεφάλαιο 6 «Database Application Development» του βιβλίου «Database Management Systems», από την ενότητα 6.2 έως και την ενότητα 6.5.2

-         Η εργασία «Jeffrey Ullman. Information Integration Using Logical Views. In 6th International Conference on Database Theory (ICDT’97), Delphi, Greece, January 1997».

-         Tο κεφάλαιο 1 «Introduction» του βιβλίου «Data on the Web».

-         Από το κεφάλαιο 2 «A Syntax for Data» του βιβλίου «Data on the Web», από την αρχή έως και την ενότητα 2.6

-         Από το κεφάλαιο 3 «XML» του βιβλίου «Data on the Web», από την αρχή έως και την ενότητα 3.3.6

-         Από το κεφάλαιο 4 «Query Languages» του βιβλίου «Data on the Web», από την αρχή έως και την ενότητα 4.5.1

-         Tο κεφάλαιο 5 «Query Languages for XML» του βιβλίου «Data on the Web».

-         Ολες οι διαφάνειες καθώς και τα αντίστοιχα κείμενα των βιβλιογραφικών εργασιών (Δ12 και Δ13).