Επισημείωση

Η επισημείωση (annotation) αποτελεί μια διαδικασία επεξεργασίας κειμένων, κατά την οποία προσαρτώνται ετικέτες (tags) σε λέξεις ή/και σύνολα λέξεων ενός κειμένου ή ενός σώματος κειμένων. Η επισημείωση μπορεί να γίνει τόσο σε πρωτογενή δεδομένα (raw data) όσο και σε κείμενο που έχει ήδη υποστεί κάποια επεξεργασία (όπως μία πρώτη επισημείωση).

Οι ετικέτες με τις οποίες περιγράφονται οι λέξεις/σύνολα λέξεων κατά τη διαδικασία της επισημείωσης δίνουν πληροφορία για το μέρος του λόγου στον οποίο ανήκουν (Part Of Speech Tagging), το λήμμα στο οποίο ανάγονται (Lemmatization), τα μορφοσυντακτικά χαρακτηριστικά (MorphoSyntactic Tagging), τη συντακτική δομή (Syntactic Parsing), ενώ μπορούν να αποδίδουν και τα σημασιολογικά χαρακτηριστικά (Semantic Annotation) ορίζοντας τμήματα κειμένου ως Ονοματικές Οντότητες (Ονόματα Φυσικών και Νομικών Προσώπων, Ονόματα Οργανισμών, Γεωγραφικές περιοχές, κτλ.), ως γεγονότα (events) ή ακόμη και συσχετίζοντάς τα σε επίπεδο συναναφοράς (Co-reference). Άλλα είδη επισημείωσης μπορεί να περιλαμβάνουν την κειμενική επισημείωση (Discourse Annotation) με τον χαρακτηρισμό τμημάτων του κειμένου σε διαπροτασιακό επίπεδο, την επισημείωση για υφολογικά ή πραγματολογικά χαρακτηριστικά του κειμένου, αλλά και την επισημείωση για συγκεκριμένα ad hoc ερευνητικά ερωτήματα.

Η επισημείωση σωμάτων κειμένων αποτελεί χρήσιμο εργαλείο τόσο για την ανάκληση και αναζήτηση πληροφορίας από μεγάλους όγκους δεδομένων όσο και για την εκπαίδευση νέων εργαλείων, την προσαρμογή ήδη υπαρχόντων εργαλείων σε νέες θεματικές περιοχές και τον έλεγχο της ακρίβειας της απόδοσής τους.

Υπηρεσίες επισημείωσης CLARIN:EL:

Η επισημείωση κειμένων που διατίθενται ελεύθερα μέσω του διαδικτύου καθώς και των κειμένων που βρίσκονται σε μορφή pdf ή/και google doc αποτελούσε ανέκαθεν μία μεγάλη πρόκληση. Το Hypothesis είναι ένα εργαλείο επισημείωσης ανοιχτού κώδικα, το οποίο επιτρέπει την επισημείωση σελίδων του παγκόσμιου ιστού.

Η Ερευνητική Υποδομή CLARIN:EL ενσωματώνει στον κατάλογο εργαλείων και υπηρεσιών γλωσσικής επεξεργασίας το Hypothesis με στόχο να παράσχει ελεύθερα σε όλους τους εγγεγραμμένους και μη χρήστες τη δυνατότητα επισημείωσης οποιασδήποτε ιστοσελίδας, παράθεσης σχολίων στις επισημειώσεις που έχει ήδη πραγματοποιήσει ένας άλλος συνάδελφος, καθώς και δημιουργίας ομάδων εργασίας στα πλαίσια ενός project επισημείωσης.

Για να χρησιμοποιήσετε την εφαρμογή Hypothesis θα πρέπει προηγουμένως να έχετε δημιουργήσει λογαριασμό και να έχετε προσθέσει την επέκταση (extension) Hypothesis Annotation tool αποκλειστικά και μόνο στον Chrome (browser).

Μπορείτε να βρείτε περισσότερες πληροφορίες για την επισημείωση με το Hypothesis στην καρτέλα μεταδεδομένων της εφαρμογής στον Κεντρικό Κατάλογο της Υποδομής CLARIN:EL ή να συμβουλευτείτε τα εγχειρίδια χρήσης.

Με στόχο το διαμοιρασμό πόρων τόσο σε εθνικό όσο και σε ευρωπαϊκό επίπεδο, η Ερευνητική Υποδομή CLARIN:EL προσφέρει πρόσβαση σε μία από τις πιστοποιημένες διαδικτυακές υπηρεσίες επισημείωσης που αναπτύχθηκε από το Τμήμα Πληροφορικής του Technische Universität Darmstadt και διατίθεται μέσω της Γερμανικής Ερευνητικής Υποδομής CLARIN-D. Πρόκειται για το WebAnno, ένα περιβάλλον το οποίο δημιουργήθηκε αποκλειστικά για την επισημείωση κειμένων, δίνοντας τη δυνατότητα στο χρήστη να δημιουργήσει τα δικά του project επισημείωσης, να μεταφορτώσει το/α αρχείο/α που επιθυμεί να επισημειώσει, να επιλέξει και να ορίσει εκείνος τα άτομα που θα συμμετάσχουν στο project του καθώς και να εξαγάγει σε μορφή συμπιεσμένου αρχείου το τελικό επισημειωμένο κείμενο ή σώμα κειμένων.

Η πρόσβαση στην Υπηρεσία επισημείωσης CLARIN:EL με το περιβάλλον του WebAnno είναι ελεύθερη για όλους τους εγγεγραμμένους χρήστες της Υποδομής εφόσον προηγουμένως έχουν κάνει login.

Bρείτε περισσότερες πληροφορίες για την λειτουργία του περιβάλλοντος επισημείωσης WebAnno στην καρτέλα μεταδεδομένων του εργαλείου στον Κεντρικό Κατάλογο της Υποδομής CLARIN:EL ή συμβουλευτείτε τα εγχειρίδια χρήσης.