Από τα βουλευτικά έδρανα στο CLARIN:EL
Με αφορμή την Διεθνή Ημέρα Κοινοβουλευτισμού (30 Ιουνίου 2023), ο μήνας αυτός αφιερώνεται στους πόρους που φιλοξενούνται στην Υποδομή CLARIN:EL και συγκροτούν την Οικογένεια Κοινοβουλευτικός Λόγος.
Η Μαρία Γαβριηλίδου (Επιστημονική Υπεύθυνη Αποθετηρίου ΕΚ Αθηνά στο CLARIN:EL) και ο Δημήτρης Γκούμας (Επιστημονικός Συνεργάτης του CLARIN:EL), μιλούν για δύο πόρους που έχουν υλοποιηθεί στο ΙΕΛ / ΕΚ Αθηνά και αφορούν τον Κοινοβουλευτικό Λόγο.
Ο πρώτος πόρος περιλαμβάνει τα Πρακτικά της Ολομέλειας του Ελληνικού Κοινοβουλίου (1989-2019). Το σώμα κειμένων με τα πρακτικά των συνεδριάσεων της Ολομέλειας του Ελληνικού Κοινοβουλίου των τελευταίων 30 χρόνων περιλαμβάνει περισσότερες από 1.000.000 ομιλίες σε μορφή TXT. Στην Υποδομή CLARIN:EL έχουν, επίσης, δημιουργηθεί και μικρότερα υποσύνολα που ανταποκρίνονται στις εκάστοτε βουλευτικές περιόδους, με στόχο την απομόνωση των ιστορικών περιόδων, αλλά και την ευκολότερη επεξεργασία από τις υπηρεσίες της Υποδομής. Η πρόσβαση στον συγκεκριμένο πόρο γίνεται ελεύθερα μέσω του CLARIN:EL για ερευνητικούς σκοπούς με Άδεια Χρήσης CC-BY (Αναφορά δημιουργού). Οι χρήστες μπορούν επίσης επισκεπτόμενοι την σελίδα εδώ να μελετήσουν μια διαδραστική οπτικοποίηση των θεματικών (topics) που απασχόλησαν το Ελληνικό Κοινοβούλιο την περίοδο 1989-2015. Μέσω αυτής της οπτικοποίησης μπορούν να αναζητηθούν οι θεματολογίες που απασχόλησαν το Ελληνικό Κοινοβούλιο τις διάφορες χρονικές περιόδους, να καταφορτωθούν οι αντίστοιχες συσχετισμένες ομιλίες, να βρεθούν οι ομιλητές και τα αντίστοιχα κόμματα. Τέλος υπάρχει η δυνατότητα να γίνει αναζήτηση των θεμάτων με βάση την ημερομηνία.
Ο δεύτερος πόρος υλοποιήθηκε στο πλαίσιο του έργου ParlaMint. Η δράση ParlaMint χρηματοδοτείται από το CLARIN ERIC για την δημιουργία συγκρίσιμων (comparable) και με κοινό τρόπο επισημειωμένων πολύγλωσσων σωμάτων κειμένων που προέρχονται από συνεδριάσεις της Βουλής διαφόρων Ευρωπαϊκών χωρών. Στόχος της δράσης υπήρξε να καταστήσει προσβάσιμα τα κοινοβουλευτικά δεδομένα, χαρακτηριστικό των οποίων είναι η άμεση αντιστοιχία με τα τρέχοντα γεγονότα, συμπεριλαμβανομένων εκείνων με παγκόσμιο αντίκτυπο στην ανθρώπινη υγεία, την κοινωνική ζωή και την οικονομία, όπως η πανδημία COVID-19. Η παρουσίασή τους σε ένα διαγλωσσικό πλαίσιο κάτω από κοινές ταξονομίες (Νομοθετικά σώματα, οργανισμοί, ονοματικές οντότητες, τύποι ομιλητών, μορφοσυντακτικές εξαρτήσεις), που επιτρέπει την διαχρονική και συγχρονική μελέτη δίνει την δυνατότητα σε ερευνητές αλλά και το ευρύ κοινό να παρακολουθήσουν τις εξελίξεις σε πανευρωπαϊκό επίπεδο.
Για τη δημιουργία του ελληνικού σώματος κειμένων (ParlaMint-GR) χρησιμοποιήθηκαν τα δεδομένα από την 1.1.2015 έως την 1.2.2022. Το υλικό είναι οργανωμένο σε βουλευτικές περιόδους, που η κάθε μία έχει τακτικές συνόδους. Κάθε σύνοδος με την σειρά της χωρίζεται σε μία ή περισσότερες συνεδριάσεις (π.χ. πρωινές/απογευματινές). Τα δεδομένα έχουν δομηθεί με βάση τις ομιλίες των μελών της Βουλής, οι οποίες εντοπίστηκαν με αυτόματες διαδικασίες.
Για κάθε ομιλία παρέχονται συγκεκριμένα μεταδεδομένα, καθώς και δομική και γλωσσική επισημείωση. Τα μεταδεδομένα περιλαμβάνουν το όνομα του ομιλητή ή της ομιλήτριας, το φύλο του/της, την κομματική ένταξη (και την αλλαγή κόμματος, εάν υπάρχει), τον ρόλο του/της (π.χ. πρωθυπουργός, υπουργός, πρόεδρος κόμματος, πρόεδρος κοινοβουλίου κ.λπ.). Για κάθε κυβέρνηση, παρέχεται η αντίστοιχη κυβερνητική περίοδος, δηλαδή η ημερομηνία έναρξης/λήξης της θητείας, οι υπουργοί της, τα αντίστοιχα υπουργεία τους με τις σχετικές ημερομηνίες, καθώς και τυχόν παραιτήσεις ή διαγραφές. Τόσο η προσθήκη μεταδεδομένων όσο και η επισημείωση έγιναν με αυτόματες διαδικασίες, με εργαλεία που έχουν αναπτυχθεί στο ΙΕΛ.
Ο πόρος αυτός διατίθεται μέσω του Εθνικού Αποθετηρίου της Σλοβενίας που ως συντονιστής του έργου έχει αναλάβει τη δημοσίευσή του. Συγκεκριμένα εδώ δίνεται η δυνατότητα να καταφορτωθεί ο πόρος χωρίς τις γλωσσικές επισημειώσεις ενώ εδώ παρέχεται ο πόρος με τις γλωσσικές επισημειώσεις.
Μαρία Γαβριηλίδου
Ερευνήτρια στο ΙΕΛ/ΕΚ ΑΘΗΝΑ
Αναπληρώτρια Διευθύντρια της Υποδομής CLARIN:EL & Επιστημονική Υπεύθυνη Αποθετηρίου ΕΚ Αθηνά στο CLARIN:EL
Πληροφορίες για τον πόρο
Ελληνικά