Παρακάτω ακολουθεί μια περιγραφή των διαφόρων εργασιών που θα μπορούσαν να γίνουν
στα πλαίσια του μαθήματος 515, "Θέματα Συστημάτων Βάσεων Δεδομένων".
Λόγω του μεγάλου πλήθους των φοιτητών αλλά και του πλούτου του όλου χώρου,
προηγείται μία γενική προσεγγιστική οργάνωση του χώρου των Συστημάτων Βάσεων
Δεδομένων, πάνω στην οποία βασίζεται και η περιγραφή των εργασιών.
ΘΕΜΑΤΟΛΟΓΙΑ
Η θεματολογία των Συστημάτων Βάσεων Δεδομένων μπορεί να οργανωθεί σε τέσσερεις
διαστάσεις. Σε κάθε διάσταση, παρατίθεται ένα βασικό σύνολο θεμάτων που αφορούν
τη διάσταση. Για μερικά δε από αυτά, παρατίθενται και πιό συγκεκριμένα υποθέματα,
που αντιπροσωπεύουν είτε σημαντικά, στενότερα υποπροβλήματα είτε σημαντικές
κατευθύνσεις που έχει ακολουθήσει ο χώρος στα θέματα αυτά.
Η παρακάτω ταξινόμηση, καθώς και τα στοιχεία κάθε διάστασης, είναι ασφαλώς
ενδεικτική και σε καμμία περίπτωση ολοκληρωτική.
Λειτουργίες |
|
Περιβάλλοντα |
|
Είδη Δεδομένων |
|
Ιδιότητες |
Γλώσσες επερωτήσεων
Δηλωτικές
Διαδικαστικές
SQL
Αντικειμενοστρεφείς
XML-ικές
Μοντέλα δεδομένων
Σχεσιακό
Αντικειμενοστρεφή
Αντικειμενοσχεσιακά
Εννοιολογικά
XML
Επεξεργασία επερωτήσεων
Βελτιστοποίηση επερωτήσεων
Αλγόριθμοι αναζήτησης
Εκτίμηση μεγεθών
Έλεγχος συνδρομικότητας
Ανάκαμψη
ARIES
Διαχείριση κύριας μνήμης
Χρήση ευρετηρίων
Μονοδιάστατα ευρετήρια
Πολυδιάστατα ευρετήρια
Υποστήριξη όψεων
Υποστήριξη περιορισμών
Υποστήριξη ενεργών κανόνων
|
|
Κεντρικά
Κατανεμημένα
Παράλληλα
Κινητά
Ασύρματα
Διαδικτύου
Ψηφιακών Βιβλιοθηκών
Ψηφιακών Υπηρεσιών
|
|
Αλφαριθμητικά
Δομημένα
Ημιδομημένα
XML
Ελεύθερο κείμενο
Επιστημονικά
Βιολογικά
Δορυφορικά
Χωρικά
Χρονικά
Χωροχρονικά
|
|
Απόδοση
Ασφάλεια
Διαθεσιμότητα
Διαχειρισιμότητα
Εκφραστικότητα
Εξατομίκευση
|
Με βάση αυτήν την ταξινόμηση, οι φοιτητές καλούνται να επιλέξουν ένα συνδυασμό
από θέματα της κάθε διάστασης (τυπικά 0 ή 1 από κάθε διάσταση, σπανιώτερα 2 ή
περισσότερα) και να κάνουν μία εργασία πάνω στα προβλήματα του υποχώρου που
προκύπτει με αυτόν τον τρόπο. Για παράδειγμα, βελτιστοποίηση επερωτήσεων σε
παράλληλες βάσεις δεδομένων ή απόδοση πολυδιάστατων ευρετηρίων για χωροχρονικά
δεδομένα.
Υποχώροι που προκύπτουν από θέματα Συστημάτων Βάσεων Δεδομένων που δεν αναφέρονται
ήδη σε κάποιες από τις διαστάσεις της παραπάνω ταξινόμησης ασφαλώς και
επιτρέπονται.
Για κάθε θεματικό υποχώρο που μπορεί να προκύψει, υπάρχουν δύο βασικοί τύποι
εργασιών: ανασκοπήσεις και υλοποιήσεις. Οι δύο τύποι αναλύονται λεπτομερειακά
παρακάτω.
ΑΝΑΣΚΟΠΗΣΕΙΣ
Το ζητούμενο σε μία τέτοια εργασία είναι η μελέτη ενός ικανοποιητικού αριθμού
από κείμενα που πραγματεύονται το θέμα της εργασίας, η αναγνώριση των βασικών
διαστάσεων και προβλημάτων του θέματος αυτού, και η γενικευμένη περιγραφή των
λύσεων που προτείνονται. Το βασικό αποτέλεσμα μιας τέτοιας
εργασίας θα είναι μία καλογραμμένη αναφορά. Κάθε τέτοια προσπάθεια μπορεί να
εστιαστεί σε ένα ή κάποιο συνδυασμό από τα εξής:
- Ερευνητικά αποτελέσματα: στην περίπτωση αυτή κύρια πηγή πληροφοριών θα είναι
ερευνητικά άρθρα από τη βιβλιογραφία. Ένα καλό αρχικό σημείο αναζήτησης τέτοιων
άρθρων είναι στο http://www.informatik.uni-trier.de/~ley/db/. Ένα άλλο καλό
σημείο είναι η ψηφιακή βιβλιοθήκη του Πανεπιστημίου που βρίσκεται μέσω του
http://www.lib.uoa.gr/ και για κάποια πράγματα και η φυσική βιβλιοθήκη του
Τμήματος. Σε κάθε περίπτωση, τα πιό σημαντικά περιοδικά και συνέδρια που πρέπει
να κοιτάζει κανείς πρώτα για την περιοχή αυτή είναι τα εξής:
Περιοδικά: ACM TODS, IEEE TKDE, VLDB Journal,
Information Systems
Συνέδρια: ACM SIGMOD, VLDB, IEEE ICDE, EDBT
- Βιομηχανικά Συστήματα Βάσεων Δεδομένων: στην περίπτωση αυτή κύρια πηγή
πληροφοριών θα είναι
τα εγχειρίδια των κυριοτέρων Συστημάτων Βάσεων Δεδομένων, δηλαδή των Oracle, DB2,
SQL Server, Sybase, κτλ. Χρήσιμες πληροφορίες μπορούν
επίσης να βρεθούν και σε άρθρα στα παραπάνω περιοδικά ή συνέδρια, όπου πολλές
φορές εμφανίζονται δουλειές που αφορούν λεπτομέρειες συγκεκριμένων συστημάτων,
καθώς και σε ελεύθερα κείμενα (white papers) που τοποθετούν οι εταιρείες στο
διαδίκτυο.
- Διάφορα άλλα συστήματα: στην περίπτωση αυτή οι πηγές πληροφοριών είναι της
ίδιας υφής με αυτών της περίπτωσης των βιομηχανικών συστημάτων, μόνο που αφορούν
άλλα συστήματα που απλώς ενσωματώνουν τεχνολογία βάσεων δεδομένων, όπως για
παράδειγμα το σύστημα SAP.
ΥΛΟΠΟΙΗΣΕΙΣ
Το ζητούμενο σε μία τέτοια εργασία είναι ο σχεδιασμός, η υλοποίηση, και πιθανώς
η αξιολόγηση ενός ή περισσοτέρων (υπο)συστημάτων ή αλγορίθμων που παρέχουν μία
συγκεκριμένη υπηρεσία που αφορά το θέμα της εργασίας. Η υλοποίηση αναμένεται να
είναι σε πιλοτικό επίπεδο, δηλαδή να δουλεύει αξιοπρεπώς αλλά χωρίς πλήρη
προστασία από λάθη χρηστών ή απόλυτη κάλυψη όλων των δυνατών περιπτώσεων.
Περιορισμοί ως προς το περιβάλλον ή τη γλώσσα υλοποίησης δεν υπάρχουν, αρκεί αυτά
να ανταποκρίνονται στη σύγχρονη πραγματικότητα. Πέραν της επίδειξης του
υλοποιηθέντος λογισμικού, οι εργασίες αυτές θα πρέπει να παράγουν και μία μικρή
αναφορά όπου να περιγράφονται περιληπτικά τα σημαντικότερα στοιχεία της
υλοποίησης.
ΔΙΑΧΕΙΡΙΣΤΙΚΑ
Κάθε εργασία μπορεί να γίνει ομαδικά (το οποίο και συνιστάται) ή ατομικά.
Κάθε ομάδα μπορεί να έχει διαφορετικό αριθμό από μέλη, και υπάρχει ελεύθερη
επιλογή στην ομάδα που θα ενταχθεί ο καθένας. Κάθε μέλος της ομάδας θα πάρει
ξεχωριστό βαθμό ανάλογα με την συνεισφορά του στο όλο έργο.
Η προθεσμία ολοκλήρωσης των εργασιών είναι η 14 Ιανουαρίου 2012.