Τεκμηρίωση

Οι πόροι που διατίθενται μέσω της Υποδομής CLARIN:EL απαραίτητα συνοδεύονται από μεταδεδομένα τεκμηρίωσης. Η διαδικασία δημιουργίας μεταδεδομένων τεκμηρίωσης για έναν πόρο προηγείται της ανάρτησής του στην Υποδομή CLARIN:EL. Έτσι, ο διαμοιρασμός ενός πόρου στο CLARIN:EL ολοκληρώνεται μόνο εφόσον ο πάροχος έχει προηγουμένως περιγράψει τον πόρο του, συμπληρώνοντας (για παράδειγμα) στοιχεία που περιγράφουν τον πόρο, τεχνικά στοιχεία για τον πόρο και στοιχεία σχετικά με τη διαθεσιμότητά του.

Η Υπηρεσία Τεκμηρίωσης CLARIN:EL έχει ως στόχο την τήρηση κοινών προδιαγραφών στην κωδικοποίηση των μεταδεδομένων τεκμηρίωσης για το σύνολο των χρηστών που ενδιαφέρονται να διαμοιραστούν πόρους μέσω της Ερευνητικής Υποδομής CLARIN:EL και την βελτίωση της προσβασιμότητας σε αυτούς. Συγκεκριμένα, περιλαμβάνει:

  • το γραφικό περιβάλλον τεκμηρίωσης πόρων με βάση το σχήμα μεταδεδομένων γλωσσικών πόρων, εργαλείων και υπηρεσιών Meta-share (Έκδοση 3.0.2) και
  • την απόδοση μοναδικού μόνιμου αναγνωριστικού ταυτοποίησης πόρων με βάση το πρότυπο handle (PID)

 

Διαβάστε περισσότερα:

Για την περιγραφή και τεκμηρίωση των πόρων, η Υποδομή CLARIN:EL χρησιμοποιεί το μοντέλο τεκμηρίωσης META-SHARE.

Η κεντρική οντότητα στην οντολογία META-SHARE είναι ο Γλωσσικός Πόρος, ο οποίος συνδέεται με άλλες περιφερειακές οντότητες όπως, ενδεικτικά,  τα κείμενα αναφοράς που σχετίζονται με τον ΓΠ (άρθρα, αναφορές, εγχειρίδια χρήσης κτλ.), άτομα και οργανισμοί που συμμετείχαν στη δημιουργία και χρήση των πόρων (δημιουργοί, διαθέτες κτλ.), σχετικά έργα και δραστηριότητες (έργα χρηματοδότησης, δράσεις χρήσης κτλ.), οι άδειες χρήσης κτλ. Η σύνδεση του ΓΠ με τις περιφερειακές οντότητες επιτρέπει την αναπαράσταση του πλήρους κύκλου ζωής ενός ΓΠ, από τη στιγμή που δημιουργείται μέχρι τη χρήση του.

Οι ΓΠ ταξινομούνται σε δύο βασικούς άξονες: είδος πόρου και είδος μέσου (δηλαδή με βάση το μέσο στο οποίο έχει υλοποιηθεί ο ΓΠ).

Είδος πόρου

Σώμα

Γραπτά/Προφορικά σώματα κειμένων, Πολυμεσικά σώματα, Πολυτροπικά σώματα

Λεξικός/Εννοιολογικός πόρος

Λεξικά, Λίστες λέξεων, Σημασιολογικά λεξικά, Ορολογικά γλωσσάρια, Οντολογίες

Περιγραφή γλώσσας

Γραμματικές, Τυπολογικές βάσεις δεδομένων, Γλωσσικά μοντέλα

Εργαλείο/Υπηρεσία

Εργαλεία, Εφαρμογές & Διαδικτυακές υπηρεσίες επεξεργασίας δεδομένων

Είδος μέσου
Κείμενο
Ήχος
Βίντεο
Εικόνα
TextNumerical
TextNgram

Όσον αφορά στο είδος μέσου (mediaType), ένας ΓΠ μπορεί να πάρει περισσότερες από μία τιμές, καθώς οι ΓΠ μπορούν να αποτελούνται από συστατικά μέρη τα οποία ανήκουν σε διαφορετικά είδη μέσου: για παράδειγμα, ένα πολυμεσικό σώμα μπορεί να περιλαμβάνει ένα μέρος σε βίντεο, ένα μέρος σε ήχο (τους διαλόγους) και ένα κειμενικό μέρος (τους υπότιτλους ή/και τη μεταγραφή των διαλόγων).

Περισσότερες πληροφορίες σχετικά με το μοντέλο τεκμηρίωσης META-SHARE μπορείτε να βρείτε εδώ.

Οι εγγραφές μεταδεδομένων που περιγράφουν τους ΓΠ που διατίθενται μέσω του CLARIN:EL πρέπει να αποθηκευθούν στην Υποδομή CLARIN:EL, διαδικασία που υποστηρίζεται από το εργαλείο τεκμηρίωσης CLARIN:EL.

Για να έχετε πρόσβαση στο εργαλείο τεκμηρίωσης θα πρέπει να είστε εγγεγραμμένος χρήστης με δικαιώματα παρόχου, όπως χαρακτηριστικά περιγράφεται εδώ. Περισσότερες πληροφορίες για τη διαδικασία που θα πρέπει να ακολουθήσετε για τον διαμοιρασμό πόρων θα βρείτε εδώ. Μόλις ενημερωθείτε ότι έχετε την κατάλληλη εξουσιοδότηση, θα μπορείτε να προσθέσετε περιγραφές για τους πόρους σας. Ανάλογα με τον ρόλο χρήστη που θα σας έχει αποδοθεί, ελέγξτε το κατάλληλο εγχειρίδιο χρήστη για περισσότερες πληροφορίες.

Για τη διευκόλυνση των χρηστών, έχουμε προετοιμάσει και θέσει στη διάθεσή τους ένα σύνολο υποδειγματικών εγγραφών μεταδεδομένων (με τη μορφή XML αρχείων), οι οποίες είναι συμβατές με το βασικό σχήμα META-SHARE. Τις εγγραφές αυτές μπορούν οι χρήστες να τις μεταφορτώσουν στην ΕΥ CLARIN:EL και να τις χρησιμοποιήσουν ως βάση για να αλλάξουν και να προσθέσουν στοιχεία που αφορούν τους δικούς τους πόρους.

Πιο συγκεκριμένα, διατίθενται εγγραφές (XML αρχεία) για τα ακόλουθα είδη πόρων: