τι είναι το clarin:el

 

 

η ελληνική και η ευρωπαϊκή υποδομή

Η υποδομή clarin:el (www.clarin.gr) είναι το ελληνικό σκέλος της ευρωπαϊκής υποδομής CLARIN (www.clarin.eu), ενός πανευρωπαϊκού δικτύου οργανισμών μέσω του οποίου συγκεντρώνονται, τεκμηριώνονται, συντηρούνται και διαμοιράζονται Γλωσσικοί Πόροι, Τεχνολογίες και διαδικτυακές Υπηρεσίες Γλωσσικής Επεξεργασίας.

Οργανωτικά, η ερευνητική υποδομή CLARIN έχει τη μορφή ενός ανοιχτού πανευρωπαϊκού δικτύου ερευνητικών κέντρων, στο οποίο συμμετέχουν φορείς με ενεργό δράση στον χώρο των Γλωσσικών Πόρων και Τεχνολογιών.                            

Συγκεκριμένα, ο πυρήνας του δικτύου CLARIN απαρτίζεται από ευρωπαϊκούς φορείς με αποδεδειγμένη αναπτυξιακή δραστηριότητα στον συγκεκριμένο χώρο, οι οποίοι έχουν δεσμευτεί για τους σκοπούς του έργου και έχουν εξασφαλίσει υποστήριξη από τα εθνικά όργανα. Σήμερα, το δίκτυο αριθμεί περισσότερα από 130 μέλη από 18 χώρες.

Μετά την ολοκλήρωση της προπαρασκευαστικής φάσης της ευρωπαϊκής υποδομής (30/6/2011), η κοινοπραξία του έργου υπέβαλε πρόταση για χρηματοδότηση της δημιουργίας του CLARIN ERIC (European Research Infrastructure Consortium) με έδρα την Ολλανδία. Η Ελλάδα συμμετείχε ενεργά στις διαδικασίας υποβολής της πρότασης καθώς και στη διαμόρφωση του καταστατικού του CLARIN ERIC. Η πρόταση εγκρίθηκε τον Νοέμβριο 2011 και το δίκτυο ξεκίνησε τη λειτουργία του τον Φεβρουάριο 2012 με ιδρυτικά μέλη τα κράτη Αυστρία, Βουλγαρία, Γερμανία, Δανία, Εσθονία, Τσεχία, Ολλανδία και τον διακρατικό οργανισμό "Ένωση για την Ολλανδική Γλώσσα". 

Η Ελλάδα έγινε μέλος του CLARIN ERIC τον Φεβρουάριο 2015.

 

 

στόχοι 

Το clarin:el ενσωματώνει σε ένα δίκτυο αποθετηρίων ψηφιακούς γλωσσικούς πόρους (κείμενο, ήχο, εικόνα, βίντεο) και εργαλεία γλωσσικής τεχνολογίας (εργαλεία αναγνώρισης φωνής, λημματοποιητές, συντακτικούς αναλυτές, εργαλεία αυτόματης εξαγωγής περίληψης, εργαλεία εξαγωγής πληροφορίας κτλ.), που θα είναι διαθέσιμα μέσω διαδικτυακών υπηρεσιών σε ερευνητές όλων των επιστημών.

Σκοπός του clarin:el είναι η δημιουργία ενός δυναμικού περιβάλλοντος εργασίας, όπου ο ερευνητής

  • θα μπορεί να έχει πρόσβαση μέσω του διαδικτύου σε ένα εικονικό αποθετήριο πόρων (το οποίο συγκεντρώνει όλους τους πόρους των δικτυωμένων κέντρων),
  • θα επιλέγει τον ή τους πόρους που τον ενδιαφέρουν για τη μελέτη του,
  • θα επιλέγει από τις προσφερόμενες ροές εργασίας (workflows) αυτήν που ταιριάζει καλύτερα στην επεξεργασία που επιθυμεί να κάνει και
  • θα μπορεί, στο τέλος, να μελετά τα αποτελέσματα της επεξεργασίας.

Δηλαδή, το clarin:el προσφέρει μια μόνιμη και σταθερή υποδομή στην οποία θα μπορούν να βασίζονται οι ερευνητές, για

  • την προσβαση σε γλωσσικούς πόρους και διαδικτυακές υπηρεσίες γλωσσικής επεξεργασίας
  • την υποστήριξη κάθε ερευνητικής δραστηριότητας που βασίζεται σε γλωσσικό υλικό (ανεξαρτήτως επιστημονικού αντικειμένου), και
  • τη διευκόλυνση της πρόσβασης σε ευρωπαϊκούς πόρους και εργαλεία, μέσω της διασύνδεσής της με την ευρωπαϊκή υποδομή.

Επιπλέον, το δίκτυο clarin:el θα προσφέρει

  • προγράμματα εκπαίδευσης στη χρήση των γλωσσικών πόρων και της γλωσσικής τεχνολογίας
  • βελτίωση και επέκταση των διαδικτυακών συνεργασιών, με τη δημιουργία εικονικών ομάδων εργασίας από ποικίλους επιστημοινικούς τομείς
  • ανάπτυξη και βελτίωση των προτύπων για τους γλωσικούς πόρους και
  • προώθηση των αρχών των ανοιχτών δεδομένων.

 

σε ποια φάση βρισκόμαστε τώρα

Η υλοποίηση της υποδομής προέβλεπε τρεις διακριτές φάσεις:

  • προπαρασκευαστική φάση
  • κατασκευαστική φάση
  • φάση πιλοτικής λειτουργίας.

Σήμερα διανύουμε την κατασκευαστική φάση του CLARIN (2012 – 15), στο πλαίσιο της οποίας υλοποιείται η υποδομή συγκέντρωσης, τεκμηρίωσης και διάθεσης γλωσσικών πόρων και εργαλείων επεξεργασίας τους.

προπαρασκευαστική φάση: το παρελθόν

Η προπαρασκευαστική φάση (έργο CLARIN-EL PREP) ολοκληρώθηκε με επιτυχία, έχοντας προετοιμάσει το έδαφος για τη δημιουργία και τη λειτουργία της ερευνητικής υποδομής clarin:el στον ελληνικό χώρο και. Συγκεκριμένα,

  • έκανε την αρχική χαρτογράφηση του χώρου
    • καταγραφή υπαρχόντων γλωσσικών πόρων και τεχνολογιών,
    • καταγραφή αναγκών των χρηστών
  • οργάνωσε την τεχνική και οικονομική προετοιμασία του δικτύου
    • τεχνική μελέτη για την υποδομή του δικτύου,
    • κατάρτιση τεχνικών προδιαγραφών για τους γλωσσικούς πόρους και τεχνολογίες,
    • μελέτη διοικητικών και νομικών θεμάτων,
    • οικονομική μελέτη για την υλοποίηση και συντήρηση του δικτύου.

Επίσης, οργάνωσε δράσεις διάχυσης με στόχο

  • την ενημέρωση των ερευνητών για το CLARIN-EL και τα οφέλη που θα προκύψουν από την ένταξη της ΓΤ στην εργασία τους, και
  • την άντληση πληροφοριών από τους δυνητικούς χρήστες της ΕΥ για το πώς οι ΓΠΤ μπορούν να ανταποκριθούν στις ανάγκες τους.

κατασκευαστική φάση: το παρόν

Στην τρέχουσα κατασκευαστική φάση (2013-2015), υλοποιείται η εθνική υποδομή CLARIN EL στο πλαίσιο της Πράξης "CLARIN – Αττική, Υποστήριξη και ανάπτυξη ελληνικών εταίρων για συμμετοχή στις Κοινοπραξίες των Ευρωπαϊκών Ερευνητικών Υποδομών στα πλαίσια του ESFRI/2006".

Η κοινοπραξία του έργου CLARIN-EL

  • υλοποιεί την ερευνητική υποδομή με τη μορφή κατανεμημένου δικτύου αποθετηρίων,
  • συγκεντρώνει και τεκμηριώνει με ενιαίο σχήμα μεταδεδομένων
    • γλωσσικούς πόρους κάθε είδους (κείμενο, ήχο, εικόνα, βίντεο, επισημειωμένα κειμενικά σώματα, ηχογραφήσεις, λεξικά, ορολογικά γλωσσάρια, οντολογίες κ.λπ.),
    • εργαλεία και υπηρεσίες γλωσσικής τεχνολογίας για τα Ελληνικά (λημματοποίηση, συντακτική ανάλυση, εξόρυξη δεδομένων, εξαγωγή γνώσης, κ.λπ.)
  • παρέχει διαδικτυακή πρόσβαση στους γλωσσικούς πόρους, τα εργαλεία και τις υπηρεσίες
  • προωθεί τη χρήση ευρέως αποδεκτών προτύπων για τους γλωσσικούς πόρους, ώστε να εξασφαλίζεται η διαλειτουργικότητά τους
  • επιτρέπει στους χρήστες να εντοπίσουν και με ευκολία να αποκτήσουν πόρους υψηλής ποιότητας
  • παρέχει τεχνική υποστήριξη στα μέλη της σχετικά με
    • τη δημιουργία, τη λειτουργία και τη συντήρηση του αποθετηρίου τους
    • την τεκμηρίωση των πόρων τους σύμφωνα με το κοινό σχήμα μεταδεδομένων και την ένταξή τους στο αποθετήριο
  • παράλληλα, οργανώνει δράσεις ενημέρωσης και εκπαίδευσης σχετικά με
    • την ερευνητική υποδομή και τις λειτουργίες της, και
    • τις δυνατότητες που προσφέρει η αξιοποίηση της Γλωσσικής Τεχνολογίας στην ερευνητική πράξη.

πιλοτική φάση: το μέλλον

Στην επόμενη φάση (2016 και μετά) η υποδομή clarin:el θα λειτουργεί πιλοτικά, διαρκώς εμπλουτιζόμενη με νέους πόρους, υπηρεσίες αλλά και με νέα αποθετήρια.

oργάνωση της υποδομής clarin:el

Η υποδομή CLARIN EL λειτουργεί ως ένα κατανεμημένο δίκτυο αποθετηρίων, με έναν κεντρικό συσσωρευτή και τοπικά αποθετήρια.

Ο κεντρικός συσσωρευτής της υποδομής clarin:el

  • λειτουργεί υπό την ευθύνη του Φορέα-Συντονιστή του δικτύου (ΕΚ "Αθηνά"), ο οποίος τον διαχειρίζεται
  • συγκεντρώνει τις περιγραφές (μεταδεδομένα) όλων των πόρων και υπηρεσιών από τα τοπικά αποθετήρια, οι οποίες ενοποιούνται σε έναν κεντρικό κατάλογο
  • παρέχει υπηρεσίες στα μέλη και στους συνεργαζόμενους παρόχους
  • επικοινωνεί με το ευρωπαϊκό δίκτυο CLARIN ERIC, προς το οποίο παρέχει μεταδεδομένα για τους ελληνικούς πόρους και υπηρεσίες, αλλά και από το οποίο αντλεί μεταδεδομένα για τους εκεί καταλογογραφημένους ή αποθηκευμένους πόρους και υπηρεσίες, προς χρήση από τα μέλη του ελληνικού δικτύου.

Τα τοπικά αποθετήρια της υποδομής clarin:el είναι οι κόμβοι του δικτύου. Είναι δύο ειδών: Ιδρυματικά Αποθετήρια και Αποθετήριο Φιλοξενούμενων Πόρων.

Αντιστοιχεί ένα Ιδρυματικό Αποθετήριο σε κάθε φορέα-μέλος του δικτύου, ο οποίος είναι υπεύθυνος για τη λειτουργία του αποθετηρίου του.

Στο δίκτυο, ωστόσο, μπορούν να συμμετάσχουν και φορείς χωρίς αποθετήριο.

Στο Αποθετήριο Φιλοξενούμενων Πόρων (ΑΦΠ) αποθηκεύονται πόροι και υπηρεσίες που παρέχονται από φορείς που δεν επιθυμούν να ιδρύσουν ιδρυματικό αποθετήριο ή από τους συνεργαζόμενους παρόχους του δικτύου. Το ΑΦΠ διαχειρίζεται ο φορέας-συντονιστής του δικτύου (το ΕΚ "Αθηνά").

Τα τοπικά αποθετήρια

  • περιλαμβάνουν τον κατάλογο και τις περιγραφές (μεταδεδομένα) των πόρων και υπηρεσιών που διαθέτει ο φορέας μέσω της υποδομής
  • αποθηκεύουν τους πόρους και τις υπηρεσίες που διαθέτει ο φορέας μέσω της υποδομής.

 

 

 

τι προσφέρει η υποδομή clarin:el

Η μελέτη της γλώσσας αποτελεί αντικείμενο του ευρύτερου χώρου των Κοινωνικών και Ανθρωπιστικών Επιστημών, ανεξάρτητα από την οπτική με την οποία ο κάθε τομέας προσεγγίζει τη γλώσσα (ενδεικτικά, ως φορέα πολιτισμικού περιεχομένου και γνώσης, εργαλείο επικοινωνίας, στοιχείο ταυτότητας και αντικείμενο μελέτης). Η ύπαρξη ηλεκτρονικά διαθέσιμων κειμένων διευκολύνει τη μελέτη της γλώσσας. Ωστόσο, ο όγκος των ψηφιακών γραπτών αλλά και προφορικών και πολυτροπικών κειμένων αυξάνεται εκθετικά, γεγονός που επιβάλλει την διαχείριση και επεξεργασία τους μέσω υπολογιστή απαραίτητη.

Η υποδομή clarin:el προσφέρει πρόσβαση σε πόρους και υπηρεσίες που διαθέτουν οι πάροχοι-μέλη του δικτύου, και συγκεκριμένα, πρόσβαση:

  • σε ψηφιακούς πόρους δεδομένων (data resources), όπως κειμενικά σώματα, πολυμεσικά σώματα, λεξικά, γραμματικές κτλ.
  • σε εργαλεία και υπηρεσίες γλωσσικής τεχνολογίας, όπως λημματοποιητές, επισημειωτές μορφοσυντακτικής πληροφορίας, εργαλεία εξαγωγής ορολογίας, εργαλεία στατιστικής ανάλυσης κειμένων κτλ., με τη μορφή εκτελέσιμων προγραμμάτων ή/και διαδικτυακών υπηρεσιών
  • στα μεταδεδομένα τεκμηρίωσης για όλους τους πόρους που θα διατίθενται μέσω αυτής. Η τεκμηρίωση αποτελεί μία από τις υποχρεώσεις των παρόχων των πόρων.

 

ανοιχτή πρόσβαση στην υποδομή

Η πρόσβαση στην ερευνητική υποδομή clarin:el είναι ελεύθερη για όλους τους φορείς ή/και ιδιώτες που ασχολούνται με τη Γλωσσική Τεχνολογία, τους Γλωσσικούς Πόρους και τη μελέτη της γλώσσας, για τους ερευνητές όλων των επιστημών, που επιθυμούν να διεξαγάγουν την έρευνά τους σε γλωσσικό υλικό αξιοποιώντας τους διατιθέμενους πόρους ή/και τα εργαλεία γλωσσικής τεχνολογίας, αλλά και για το ευρύ κοινό.

Η πρόσβαση στο υλικό της υποδομής ρυθμίζεται ως εξής:

  • όλα τα μεταδεδομένα τεκμηρίωσης είναι ελεύθερα προσβάσιμα σε όλους (με άδεια CC0)
  • οι πόροι και οι υπηρεσίες διατίθενται με άδεια χρήσης η οποία καθορίζεται από τον πάροχο και ρυθμίζει όλες τις επιτρεπόμενες χρήσεις και τις υποχρεώσεις που θα πρέπει να τηρούν οι τελικοί χρήστες.

ποιοι μπορούν να χρησιμοποιούν την υποδομή

Η υποδομή clarin:el είναι διαθέσιμη σε όλους, δηλαδή

  • στα μέλη του δικτύου,
  • στους συνεργαζόμενους παρόχους, 
  • στους εγγεγραμμένους χρήστες, και
  • σε απλούς επισκέπτες χρήστες (χωρίς εγγραφή).

Ωστόσο, τα μέλη του δικτύου, οι συνεργαζόμενοι πάροχοι και οι εγγεγραμμένοι χρήστες έχουν πρόσβαση στο σύνολο των λειτουργιών της υποδομής, ενώ οι επισκέπτες χρήστες σε περιορισμένες λειτουργίες.

εγγραφή στην υποδομή

Μπορεί κανείς να εγγραφεί στην υποδομή από εδώ.