Meltemi: το πρώτο ανοιχτό Μεγάλο Γλωσσικό Μοντέλο για τα Ελληνικά

Η ανάπτυξη και χρήση Μεγάλων Γλωσσικών Μοντέλων (Large Language Models, LLMs) σηματοδότησε μια σημαντική τομή της Τεχνητής Νοημοσύνης, ανοίγοντας νέες ευκαιρίες για έρευνα και βιομηχανικές εφαρμογές. Ωστόσο, τα LLM επιδεικνύουν εντυπωσιακές ικανότητες μόνο σε «μεγάλες» γλώσσες, όπως τα Αγγλικά, ενώ η απόδοσή τους ποικίλλει σημαντικά μεταξύ διαφορετικών γλωσσών. Ειδικά στην περίπτωση γλωσσών με χαμηλούς πόρους, όπως η Ελληνική, τα υπάρχοντα ανοιχτά LLM παρουσιάζουν χαμηλή απόδοση λόγω έλλειψης δεδομένων εκπαίδευσης.

Το Ινστιτούτο Επεξεργασίας του Λόγου του Ερευνητικού Κέντρου Αθηνά (ΙΕΛ/ΕΚ Αθηνά) παρουσιάζει το Meltemi, το πρώτο ανοιχτό Μεγάλο Γλωσσικό Μοντέλο για την ελληνική γλώσσα, διαθέσιμο για ερευνητικούς αλλά και εμπορικούς σκοπούς. Βασισμένο στο Mistral-7Β, το Meltemi βελτιώνει σε σημαντικό βαθμό τις επιδόσεις του Mistral στην κατανόηση και παραγωγή γλώσσας στα Ελληνικά, καθώς έχει αναπτυχθεί μέσω συνεχιζόμενης προ-εκπαίδευσης (continual pre-training) σε ένα μεγάλο σώμα ελληνικών κειμένων υψηλής ποιότητας (28.5 δισ. tokens).

Διαβάστε περισσότερα

Πρόγραμμα χρηματοδότησης ATRIUM TNA - πρόσκληση για υποβολή αιτήσεων

Το έργο ATRIUM προσκαλεί ερευνητές να υποβάλουν αίτηση για συμμετοχή σε μία πλήρως χρηματοδοτούμενη δράση για διακρατική πρακτική άσκηση ή εκπαιδευτική επίσκεψη σε κάποιον από τους οργανισμούς-εταίρους του έργου προκειμένου να αποκτήσουν πρόσβαση σε υποδομές, δεδομένα, υπηρεσίες, γνώσεις και επίβλεψη από εμπειρογνώμονες κορυφαίων οργανισμών που ασχολούνται με τη συλλογή και διαχείριση δεδομένων σε ολόκληρη την Ευρώπη με σκοπό την υποστήριξη της έρευνάς τους.

Η δράση TNA (Transnational Access) έχει ως στόχο να υποστηρίξει περίπου 200 ερευνητές των Ανθρωπιστικών Επιστημών και Τεχνών προσφέροντάς τους καθοδήγηση, υποστήριξη και πρόσβαση σε γνώσεις, δεδομένα, υπηρεσίες και εργαλεία 14 διαφορετικών φορέων σε όλη την Ευρώπη.

Προσκλήσεις για υποβολή αιτήσεων θα δημοσιεύονται αρκετές φορές τον χρόνο, καθ’ όλη τη διάρκεια του έργου (Μάρτιος 2024 - Δεκέμβριος 2028). Η πρώτη προθεσμία υποβολής αιτήσεων είναι η 31η Μαΐου 2024 και οι υποψήφιοι θα ενημερωθούν για τα αποτελέσματα στις 28 Ιουνίου 2024.

Μάθετε περισσότερα
 
DILITAL

LREC-COLING 2024 International Conference

Η Ένωση Γλωσσικών Πόρων ELRA και η Διεθνής Επιτροπή για την Υπολογιστική Γλωσσολογία ICCL, ενώνουν τις δυνάμεις τους για τη διοργάνωση του 2024 Joint International Conference on Computational Linguistics, Language Resources and Evaluation (LREC-COLING 2024) που θα πραγματοποιηθεί στο Τορίνο της Ιταλίας στις 20-25 Μαΐου 2024. Το υβριδικό συνέδριο θα φέρει σε επαφή ερευνητές και επαγγελματίες που εργάζονται στον τομέα της υπολογιστικής γλωσσολογίας, της ομιλίας, της πολυτροπικότητας και της επεξεργασίας φυσικής γλώσσας, με ιδιαίτερη έμφαση στην αξιολόγηση και την ανάπτυξη πόρων που υποστηρίζουν την εργασία σε αυτούς τους τομείς.


Διαβάστε περισσότερα »

Legal and Ethical Issues in Human Language Technologies Workshop (LEGAL 2024)

Το Εργαστήριο LEGAL 2024 - Legal and Ethical Issues in Human Language Technologies θα πραγματοποιηθεί στις 25 Μαΐου 2024, στο Τορίνο της Ιταλίας, στα πλαίσια του Συνεδρίου LREC-COLING 2024. Στόχος του εργαστηρίου είναι να δημιουργηθούν γέφυρες μεταξύ τεχνολογίας και νομικού πλαισίου, καθώς και να συζητηθούν τα τρέχοντα νομικά και ηθικά ζητήματα στον τομέα της τεχνολογίας της ανθρώπινης γλώσσας.

Διαβάστε περισσότερα »

 

Conference on Language Technologies and Digital Humanities: Resources and Applications (LTаDH-RA 2024) - πρόσκληση για υποβολή προτάσεων

Η Υποδομή CLaDA-BG διοργανώνει το 3ο Διεθνές Συνέδριο LTаDH-RA 2024 - Language Technologies and Digital Humanities: Resources and Applications στις 26 με 28 Ιουνίου 2024 στην Σόφια της ΒουλγαρίαςΠροθεσμία υποβολής προτάσεων: 28 Απριλίου 2024.

Διαβάστε περισσότερα »

 

ESSAI & ACAI 2024

Η Ευρωπαϊκή Ένωση για την Τεχνητή Νοημοσύνη (EurAI) σε συνεργασία με την Ομάδα Τεχνητής Νοημοσύνης του Τμήματος Πληροφορικής και Τηλεπικοινωνιών του Εθνικού και Καποδιστριακού Πανεπιστημίου Αθηνών και την Ελληνική Εταιρεία Τεχνητής Νοημοσύνης, διοργανώνουν το Ευρωπαϊκό Θερινό Σχολείο Τεχνητής Νοημοσύνης (ESSAI 2024) και το Advanced Course on Artificial Intelligence (ACAI 2024) στις 15 - 26 Ιουλίου 2024 στην Αθήνα.


Διαβάστε περισσότερα »

 

 
DILITAL 
 
 
 

NLP4CALL 2024 Workshop - πρόσκληση για υποβολή προτάσεων

Το Εργαστήριο NLP4CALL 2024 θα πραγματοποιηθεί στις 25 και 26 Οκτωβρίου 2024 στο Πανεπιστήμιο της Ρεν στην Γαλλία. Παρουσιάσεις δημοσιεύσεων, poster αλλά και συνεδρίες αφιερωμένες σε demo θα πραγματοποιηθούν κατά τη διεξαγωγή του NLP4CALL 2024  προσφέροντας μια ολοκληρωμένη εικόνα των τελευταίων εξελίξεων του τομέα. Προθεσμία υποβολής προτάσεων: 30 Ιουνίου 2024


Διαβάστε περισσότερα »

 

2ο Θερινό Σχολείο Επεξεργασίας Φυσικής Γλώσσας AthNLP 2024

Το Ερευνητικό Κέντρο "Αθηνά", το ΕΚΕΦΕ "ΔΗΜΟΚΡΙΤΟΣ", το Οικονομικό Πανεπιστήμιο Αθηνών και το Πανεπιστήμιο Herriot-Watt, διοργανώνουν το 2ο Θερινό Σχολείο Επεξεργασίας Φυσικής Γλώσσας AthNLP 2024 στις 19-25 Σεπτεμβρίου 2024 στις εγκαταστάσεις του ΕΚΕΦΕ "ΔΗΜΟΚΡΙΤΟΣ". Σύντομα θα αναρτηθούν περισσότερες πληροφορίες στην επίσημη ιστοσελίδα του Θερινού Σχολείου εδώ. Μείνετε συντονισμένοι!


Διαβάστε περισσότερα »

 

 
DILITAL 
 
 
 

Μπορεί επίσης να σας ενδιαφέρουν:

Σειρά διαδικτυακών σεμιναρίων CLARIN:EL 2023-2024: παρακολουθήστε τα βίντεο στο YouTube

Επισκεφθείτε το επίσημο κανάλι του CLARIN:EL στο YouTube και παρακολουθήστε τα βίντεο της σειράς διαδικτυακών σεμιναρίων της Υποδομής CLARIN:EL που μόλις ανέβηκαν! Τα εκπαιδευτικά σεμινάρια διοργανώθηκαν από το ΙΕΛ/ΕΚ Αθηνά και την Εθνική Υποδομή για τις Ψηφιακές Ανθρωπιστικές Επιστήμες και Τέχνες και για τη Γλωσσική Έρευνα και Καινοτομία ΑΠΟΛΛΩΝΙΣ, στο πλαίσιο του  Έργου ΨΗΦΙΑΚΟ ΤΟΠΙΟ και πραγματοποιήθηκαν το διάστημα Νοεμβρίου 2023 - Μαρτίου 2024.

Ανακαλύψτε περισσότερα