|
Το έργο CLARIN (http://www.clarin.eu) είναι μία πανευρωπαϊκής εμβέλειας προσπάθεια να συγκεντρωθούν, να συντονιστούν και, τελικά, να διατεθούν στην ερευνητική κοινότητα γλωσσικοί πόροι (ΓΠ) σε όλες τις γλώσσες, μέσω μιας διαδικτυακής Ερευνητικής Υποδομής που θα περιλαμβάνει και σχετικά γλωσσικά εργαλεία. Η πρωτοβουλία αυτή απευθύνεται κυρίως στην ερευνητική κοινότητα των Κοινωνικών και Ανθρωπιστικών Επιστημών, οργανωτικά έχει τη μορφή πανευρωπαϊκού δικτύου ερευνητικών κέντρων, και στοχεύει να παράσχει στους ερευνητές
- πληροφορία σχετικά με την ύπαρξη ΓΠ
- συντονισμό της δημιουργίας, αρχειοθέτησης, διαχείρισης και πρόσβασης στους ΓΠ
- πρόσβαση σε υπηρεσίες και γλωσσικά εργαλεία για την επεξεργασία των ΓΠ
- τεχνογνωσία σχετικά με τη χρήση της γλωσσικής τεχνολογίας.
|
|
Τι είναι οι γλωσσικοί πόροι και τεχνολογίες; |
|
Με τον όρο Γλωσσικοί Πόροι (ΓΠ) και Γλωσσικές Τεχνολογίες (ΓΤ) αναφερόμαστε σε κάθε πηγή γνώσης που βασίζεται στη γλώσσα (γραπτή ή προφορική) και στα εργαλεία που χρησιμοποιούνται για την επεξεργασία τους. Ειδικότερα, διακρίνονται οι εξής κατηγορίες:
- πόροι πρωτογενούς περιεχομένου: πρόκειται για πόρους ψηφιακού / ψηφιοποιημένου λόγου, όπως γραπτά κείμενα (π.χ. ψηφιοποιημένα βιβλία, κείμενα από διαδικτυακούς κόμβους, εφημερίδες, σώματα κειμένων κτλ.), ηχογραφήσεις προφορικού λόγου (π.χ. συνεντεύξεις, ραδιοφωνικές εκπομπές κτλ.), βιντεοσκοπήσεις (π.χ. τηλεοπτικές εκπομπές, ειδικές συλλογές με εκφράσεις προσώπου, χειρονομίες κτλ.), εικόνες (π.χ. ψηφιακές ή ψηφιοποιημένες φωτογραφίες, πίνακες κτλ. με τις λεζάντες τους) κτλ.
- πόροι επεξεργασμένου υλικού: διαφόρων ειδών επισημειώσεις σε κείμενα, ήχο και πολυμεσικά δεδομένα που έχουν δημιουργηθεί αυτόματα ή με το χέρι (π.χ. μορφοσυντακτικά επισημειωμένα κείμενα, μεταγραφές ηχητικών αρχείων, επισημειωμένα αρχεία βίντεο κτλ.)
- πόροι αναφοράς: διάφοροι τύποι οργάνωσης της γνώσης για τη γλώσσα (π.χ. λίστες λέξεων, λεξικά, θησαυροί κτλ.), οι οποίοι μπορούν να χρησιμοποιηθούν για την καλύτερη οργάνωση, επεξεργασία και μελέτη των πόρων πρωτογενούς περιεχομένου
- εργαλεία/εφαρμογές γλωσσικής τεχνολογίας: εργαλεία και ολοκληρωμένες εφαρμογές που επιτελούν διάφορους τύπους γλωσσικής επεξεργασίας (π.χ. στοίχιση πολύγλωσσων κειμένων, μορφολογική επισημείωση, λημματοποίηση, συντακτική ανάλυση, εξόρυξη γνώσης κτλ.), καθώς και παρουσίασης/προβολής των δεδομένων (π.χ. ολοκληρωμένα περιβάλλοντα προβολής κειμένων, συλλογών πολυμεσικών δεδομένων κτλ.).
|
|
Τι θα προσφέρει το CLARIN στους ερευνητές; |
|
Η μελέτη της γλώσσας αποτελεί αντικείμενο του ευρύτερου χώρου των Κοινωνικών και Ανθρωπιστικών Επιστημών, ανεξάρτητα από την οπτική με την οποία ο κάθε τομέας προσεγγίζει τη γλώσσα (ενδεικτικά, ως φορέα πολιτισμικού περιεχομένου και γνώσης, εργαλείο επικοινωνίας, στοιχείο ταυτότητας και αντικείμενο μελέτης). Η ύπαρξη ηλεκτρονικά διαθέσιμων κειμένων διευκολύνει τη μελέτη της γλώσσας. Ωστόσο, ο όγκος των ψηφιακών γραπτών αλλά και προφορικών και πολυτροπικών κειμένων αυξάνεται εκθετικά, γεγονός που επιβάλλει την διαχείριση και επεξεργασία τους μέσω υπολογιστή απαραίτητη.
Σκοπός του CLARIN είναι η δημιουργία ενός δυναμικού εικονικού περιβάλλοντος εργασίας, όπου ο ερευνητής θα μπορεί να έχει πρόσβαση μέσω του διαδικτύου σε ένα εικονικό αποθετήριο πόρων (το οποίο συγκεντρώνει όλους τους πόρους των δικτυωμένων κέντρων), θα επιλέγει τον ή τους πόρους που τον ενδιαφέρουν για τη μελέτη του, θα επιλέγει από τις προσφερόμενες ροές εργασίας (workflows) αυτήν που ταιριάζει καλύτερα στα αποτελέσματα που επιθυμεί να έχει και θα μπορεί, στο τέλος, να μελετά τα αποτελέσματα της επεξεργασίας. |
|
Σε ποια φάση είναι τώρα τα έργα CLARIN και CLARIN-EL; |
|
Σήμερα διανύουμε την προπαρασκευαστική φάση για το CLARIN (2008 – 10), με κύριο αντικείμενο τη χαρτογράφηση του χώρου (καταγραφή γλωσσικών πόρων και τεχνολογιών), την οργανωτική, τεχνική και οικονομική προετοιμασία του δικτύου (τεχνική μελέτη για την υποδομή του δικτύου, κατάρτιση τεχνικών προδιαγραφών για τους γλωσσικούς πόρους και τεχνολογίες, μελέτη διοικητικών και νομικών θεμάτων, οικονομική μελέτη για την υλοποίηση και συντήρηση του δικτύου). Το 2010, εφόσον εγκριθεί η σχετική χρηματοδότηση, θα ξεκινήσει το στάδιο υλοποίησης, το οποίο και θα διαρκέσει 5 χρόνια.
Στην Ελλάδα, η ΓΓΕΤ έχει εγκρίνει το έργο CLARIN-EL PREP, με σκοπό να καταδείξει τη χρησιμότητα της ΕΥ CLARIN για την ελληνική ερευνητική κοινότητα. Στο πλαίσιο αυτό, διεξάγεται έρευνα για τους υπάρχοντες γλωσσικούς πόρους και τεχνολογίες για την ελληνική γλώσσα, καταγραφή των φορέων που ασχολούνται με τη γλωσσική τεχνολογία στην Ελλάδα, των πιθανών παρόχων πόρων πρωτογενούς περιεχομένου, καθώς και των δυνητικών χρηστών της υποδομής, ανάλυση των αναγκών της ερευνητικής κοινότητας, σχέδιο διοικητικής και τεχνικής οργάνωσης του δικτύου κτλ. |
|
Ποιοι μπορούν να συμμετάσχουν στο δίκτυο CLARIN-EL; |
|
Στο δίκτυο CLARIN-EL μπορούν να συμμετάσχουν φορείς ή/και ιδιώτες ερευνητές που:
- ασχολούνται με τη γλωσσική τεχνολογία και επιθυμούν να διαθέσουν τους γλωσσικούς πόρους και τα εργαλεία γλωσσικής τεχνολογίας που έχουν αναπτύξει μέσω της ερευνητικής υποδομής CLARIN,
- έχουν συγκεντρώσει γλωσσικούς πόρους σε ψηφιακή μορφή οι οποίοι θα μπορούσαν να αποτελέσουν αντικείμενο έρευνας (π.χ. αρχεία ψηφιοποιημένων βιβλίων, συλλογές χειρογράφων, οπτικοακουστικό υλικό κτλ.) και ενδιαφέρονται να τα διαθέσουν μέσω της ερευνητικής υποδομής CLARIN,
- επιθυμούν να έχουν πρόσβαση στην υποδομή CLARIN για να διεξαγάγουν την έρευνά τους σε γλωσσικό υλικό αξιοποιώντας τους διατιθέμενους πόρους ή/και τα εργαλεία γλωσσικής τεχνολογίας.
|
|
Τι σημαίνει να γίνω μέλος του δικτύου CLARIN-EL; |
|
Το δίκτυο CLARIN-EL βρίσκεται στην προπαρασκευαστική φάση. Στο μέλλον (φάση αξιοποίησης), θα μπορείτε να χρησιμοποιήσετε τις υπηρεσίες του δικτύου για τις μελέτες σας, εφόσον δραστηριοποιείστε στον ερευνητικό χώρο. Στην παρούσα φάση τα μέλη του δικτύου μπορούν να συνεισφέρουν, με βάση την ειδικότητα, την τεχνογνωσία και τα ενδιαφέροντά τους, στην καταγραφή των ΓΠΤ που διατίθενται για την ελληνική γλώσσα, στη συγκέντρωση πληροφοριών για γλωσσικούς πόρους που πιθανόν να ενδιαφέρουν τους ερευνητές των ΚΑΕ, πιθανές εργασίες ή/και ερευνητικούς τομείς που θεωρείτε ότι θα μπορούσαν να επωφεληθούν από τη γλωσσική τεχνολογία , στην κατάρτιση προδιαγραφών για τη χρήση των εργαλείων κτλ.
Η λειτουργία του δικτύου γίνεται κυρίως με ηλεκτρονικά μέσα επικοινωνίας (προβολή μέσω του κόμβου, λίστα e-mail, φόρουμ κτλ.) καθώς και ανοιχτές αλλά και κλειστές συναντήσεις, ημερίδες, εργαστήρια κτλ. |
|
Πώς μπορώ να γίνω μέλος του δικτύου CLARIN-EL; |
|
Για να εκδηλώσετε ενδιαφέρον για συμμετοχή στο δίκτυο, αρκεί να συμμετάσχετε στη χαρτογράφηση του χώρου, συμπληρώνοντας όποιο/α από τα ερωτηματολόγια ταιριάζουν στην περίπτωσή σας. |
|