Τεκμηρίωση

Οι πόροι που διατίθενται μέσω της Υποδομής CLARIN:EL απαραίτητα συνοδεύονται από μεταδεδομένα τεκμηρίωσης. Η διαδικασία δημιουργίας μεταδεδομένων τεκμηρίωσης για έναν πόρο προηγείται της ανάρτησής του στην Υποδομή CLARIN:EL. Έτσι, ο διαμοιρασμός ενός πόρου στο CLARIN:EL ολοκληρώνεται μόνο εφόσον ο πάροχος έχει προηγουμένως περιγράψει τον πόρο του, συμπληρώνοντας (για παράδειγμα) στοιχεία που περιγράφουν τον πόρο, τεχνικά στοιχεία για τον πόρο και στοιχεία σχετικά με τη διαθεσιμότητά του.

Η Υπηρεσία Τεκμηρίωσης CLARIN:EL έχει ως στόχο την τήρηση κοινών προδιαγραφών στην κωδικοποίηση των μεταδεδομένων τεκμηρίωσης για το σύνολο των χρηστών που ενδιαφέρονται να διαμοιραστούν πόρους μέσω της Ερευνητικής Υποδομής CLARIN:EL και την βελτίωση της προσβασιμότητας σε αυτούς. Συγκεκριμένα, περιλαμβάνει:

  • το γραφικό περιβάλλον τεκμηρίωσης πόρων με βάση το σχήμα μεταδεδομένων γλωσσικών πόρων, εργαλείων και υπηρεσιών CLARIN-SHARE (Έκδοση 1.0.1) και
  • την απόδοση μοναδικού μόνιμου αναγνωριστικού ταυτοποίησης πόρων με βάση το πρότυπο handle (PID)

Διαβάστε περισσότερα:

Για την περιγραφή και τεκμηρίωση των πόρων, η Υποδομή CLARIN:EL χρησιμοποιεί το μοντέλο τεκμηρίωσης CLARIN-SHARE, το οποίο βασίζεται στο μοντέλο META-SHARE.

Η κεντρική οντότητα στην οντολογία CLARIN-SHARE είναι ο Γλωσσικός Πόρος, ο οποίος συνδέεται με άλλες περιφερειακές οντότητες όπως, ενδεικτικά,

  • τα κείμενα αναφοράς που σχετίζονται με τον ΓΠ (άρθρα, αναφορές, εγχειρίδια χρήσης κτλ.),
  • άτομα και οργανισμοί που συμμετείχαν στη δημιουργία και χρήση των πόρων (δημιουργοί, διαθέτες κτλ.),
  • σχετικά έργα και δραστηριότητες (έργα χρηματοδότησης, δράσεις χρήσης κτλ.),
  • οι άδειες χρήσης κτλ.

Η σύνδεση του ΓΠ με τις περιφερειακές οντότητες επιτρέπει την αναπαράσταση του πλήρους κύκλου ζωής ενός ΓΠ, από τη στιγμή που δημιουργείται μέχρι τη χρήση του.

Οι ΓΠ ταξινομούνται σε δύο βασικούς άξονες: είδος πόρου και είδος μέσου (δηλαδή με βάση το μέσο στο οποίο έχει υλοποιηθεί ο ΓΠ).

Είδος πόρου

Σώμα

Γραπτά/Προφορικά σώματα κειμένων, Πολυμεσικά σώματα, Πολυτροπικά σώματα

Λεξικός/Εννοιολογικός πόρος

Λεξικά, Λίστες λέξεων, Σημασιολογικά λεξικά, Ορολογικά γλωσσάρια, Οντολογίες

Περιγραφή γλώσσας

Γραμματικές, Τυπολογικές βάσεις δεδομένων, Γλωσσικά μοντέλα

Εργαλείο/Υπηρεσία

Εργαλεία, Εφαρμογές & Διαδικτυακές υπηρεσίες επεξεργασίας δεδομένων

Είδος μέσου
Κείμενο
Ήχος
Βίντεο
Εικόνα
ΑριθμητικόΚείμενο
TextNgram

Όσον αφορά στο είδος μέσου (mediaType), ένας ΓΠ μπορεί να πάρει περισσότερες από μία τιμές, καθώς οι ΓΠ μπορούν να αποτελούνται από συστατικά μέρη τα οποία ανήκουν σε διαφορετικά είδη μέσου: για παράδειγμα, ένα πολυμεσικό σώμα μπορεί να περιλαμβάνει ένα μέρος σε βίντεο, ένα μέρος σε ήχο (τους διαλόγους) και ένα κειμενικό μέρος (τους υπότιτλους ή/και τη μεταγραφή των διαλόγων). Περισσότερες πληροφορίες σχετικά με το μοντέλο τεκμηρίωσης CLARIN-SHARE μπορείτε να βρείτε εδώ.

Οι εγγραφές μεταδεδομένων που περιγράφουν τους ΓΠ που διατίθενται μέσω του CLARIN:EL πρέπει να αποθηκευθούν στην Υποδομή CLARIN:EL, διαδικασία που υποστηρίζεται από το περιβάλλον τεκμηρίωσης & ανάρτησης πόρων CLARIN:EL.

Για να έχετε πρόσβαση στο περιβάλλον αυτό θα πρέπει να είστε εγγεγραμμένος χρήστης της Υποδομής προκειμένου να αποκτήσετε δικαιώματα παρόχου, τα οποία και θα σας επιτρέψουν την τεκμηρίωση, την ανάρτηση και τον διαμοιρασμό των Γλωσσικών Πόρων σας μέσω της Ερευνητικής Υποδομής CLARIN:EL. Περισσότερες πληροφορίες για τον διαμοιρασμό πόρων θα βρείτε εδώ.

 

Μπορείτε να βρείτε πληροφορίες και αναλυτικές οδηγίες σχετικά με την τεκμηρίωση πόρων, τις κατηγορίες χρηστών, τα δικαιώματα και τις δικαιοδοσίες τους στην Υποδομή CLARIN:EL και στο ηλεκτρονικό εγχειρίδιο χρήσης του CLARIN:EL εδώ.