Ανάκτηση Πληροφορίας (Information Retrieval)

Η Ανάκτηση Πληροφορίας (ΑΠ) [29] πραγματεύεται την αναπαράσταση, αποθήκευση, οργάνωση και πρόσβαση των αντικειμένων πληροφορίας. Ως επί το πλείστον στην ΑΠ τα αντικείμενα πληροφορίας είναι τα έγγραφα. Η αναπαράσταση και οργάνωση των αντικειμένων πληροφορίας θα πρέπει να παρέχουν στο χρήστη εύκολη πρόσβαση σε πληροφορίες για τις οποίες αυτός ενδιαφέρεται. Δυστυχώς, η απόδοση των πληροφοριών που χρειάζεται ο χρήστης (user information need) δεν είναι απλό πρόβλημα. Έστω για παράδειγμα, η παρακάτω υποθετική πληροφορία που χρειάζεται ο χρήστης στα πλαίσια του Παγκόσμιου Ιστού:

Βρες όλες τις σελίδες (έγγραφα) που περιέχουν πληροφορίες για ομάδες αντισφαίρισης κολεγίων που (1) συντηρούνται από ένα πανεπιστήμιο των Ηνωμένων Πολιτειών και (2) συμμετέχουν στο τουρνουά αντισφαίρισης NCAA. Η κάθε σελίδα θα πρέπει να περιλαμβάνει πληροφορίες για την εθνική κατάταξη της ομάδας τα τρία τελευταία χρόνια και τη διεύθυνση ηλεκτρονικού ταχυδρομείου ή τον αριθμό τηλεφώνου του προπονητή της ομάδας.

Είναι σαφές, ότι αυτή η εκτενής περιγραφή των πληροφοριών που χρειάζεται ο χρήστης δεν μπορεί να αιτηθεί άμεσα χρησιμοποιώντας την τρέχουσα διεπαφή που προσφέρουν οι μηχανές αναζήτησης του Ιστού. Έτσι, ο χρήστης θα πρέπει πρώτα να μεταφράσει τις πληροφορίες που χρειάζεται σε μία επερώτηση (query), η οποία να μπορεί να επεξεργασθεί από μία μηχανή αναζήτησης (ή σύστημα ΑΠ). Στην πιο απλή μορφή της, αυτή η μετάφραση παράγει ένα σύνολο λέξεων-κλειδιών (keywords) ή όρους ευρετηρίου (index terms) που αποτελούν μία περιληπτική περιγραφή της πληροφορίας που χρειάζεται ο χρήστης. Δοθείσης μίας επερώτησης ενός χρήστη, ο αντικειμενικός σκοπός ενός συστήματος ΑΠ είναι να ανακτήσει τις πληροφορίες που δύναται να είναι χρήσιμες ή σχετικές στον χρήστη.



Subsections

Charalampos Nikolaou 2008-04-02