
Οι Οικογένειες Γλωσσικών Πόρων του CLARIN (CLARIN Resource Families) είναι μια πρωτοβουλία της Ευρωπαϊκής Υποδομής Γλωσσικών Πόρων και Τεχνολογιών CLARIN ERIC που έχει ως στόχο τη συγκέντρωση καθώς και την ανάδειξη όλων των πόρων που διατίθενται μέχρι σήμερα σε όλες τις εθνικές Υποδομές CLARIN. Η παρουσίαση των πόρων γίνεται σε ομάδες σύμφωνα με συγκεκριμένα χαρακτηριστικά που διαθέτει ο κάθε πόρος, όπως η θεματική περιοχή ή/και οι γλώσσες στις οποίες αυτοί διατίθενται. Μέχρι στιγμής έχουν δημιουργηθεί οι παρακάτω δέκα Οικογένειες για τα σώματα κειμένων:
- Computer-mediated communication corpora
- Corpora of academic texts
- Historical corpora
- L2 learner corpora
- Literary corpora
- Newspaper corpora
- Parallel corpora
- Manually annotated corpora
- Parliamentary corpora
- Spoken corpora
Η δημιουργία των συλλογών αυτών έχει γίνει από τους Darja Fišer και Jakob Lenardič σε συνεργασία με τους υπεύθυνους και συντονιστές δράσεων σε εθνικό επίπεδο για την προσέλκυση και συμμετοχή χρηστών στις Υποδομές. Πληροφορίες για τους γλωσσικούς πόρους έχουν συγκεντρωθεί και από ιδιώτες που συμμετείχαν σε εργαστήρια και ομάδες εργασίας.
Η Υποδομή CLARIN:EL συμμετέχει ενεργά στην πρωτοβουλία αυτή έχοντας συνεισφέρει μέχρι σήμερα πάνω από 90 πόρους συνολικά για όλες τις Οικογένειες Σωμάτων Κειμένων που διατίθενται μέσω της Ευρωπαϊκής Υποδομής CLARIN ERIC.
Ακολουθεί αναλυτική παρουσίαση, κατά Οικογένεια, όλων των σωμάτων κειμένων για τα ΕΛΛΗΝΙΚΑ:
Computer-mediated communication corpora
- Xenophobia - Verbal Aggressiveness Database (Target Group: Muslims/Islam)
- Xenophobia - Verbal Aggressiveness Database (Target Group: Albanians)
- Xenophobia - Verbal Aggressiveness Database (Target Group: Jews)
- Xenophobia - Verbal Aggressiveness Database (Target Group: Roma)
- Xenophobia - Verbal Aggressiveness Database (Target Group: Pakistani)
- Xenophobia - Verbal Aggressiveness Database (Target Group: Romanians)
- Xenophobia - Verbal Aggressiveness Database (Target Group: Germans)
- Xenophobia - Verbal Aggressiveness Database (Target Group: Syrians)
- Xenophobia - Verbal Aggressiveness Database (Target Group: Immigrants)
- Xenophobia - Verbal Aggressiveness Database (Target Group: Refugees)
- Xenophobia - Event Database
Corpora of academic texts
Historical corpora
L2 learner corpora
Literary corpora
Newspaper corpora
- ACCURAT corpus of comparable sentences
- QTLP Greek CC Corpus for the Medical Domain
- QTLP Greek Corpus for the Medical Domain
- QTLP Greek Corpus for the Automotive Domain
- Parallel Global Voices
- SETIMES - A parallel corpus of the Balkan languages
- QTLP Portuguese-Greek Corpus for the AUTOMOTIVE domain
- QTLP English-Greek Corpus for the AUTOMOTIVE domain
- QTLP English-Greek Corpus for the MEDICAL domain
- Hellenic National Corpus
- Theodoros Pangalos' Articles in the Greek Newspaper "To Vima"
- Corpus "Library and Information Centre - Newspapers"
- Modern Greek Texts Corpus - "Makedonia" newspaper
- Modern Greek Texts Corpus - "Ta Nea" newspaper
Parallel corpora
- Parallel corpus newsletters IFT FR-GR
- Europarl Parallel Corpus
- JRC-Acquis Multilingual Parallel Corpus
- MLCC Multilingual and Parallel Corpora
- MUSA Multilingual Multimodal Corpus
- PANACEA English-French and English-Greek parallel corpus
- PELCRA mutlilingual parallel corpora
- SETimes
- REVEAL-THIS Corpus
- ACCURAT balanced test corpus for under resourced languages
- UP/TAP
- European Parliament Proceedings Parallel Corpus 1996-2011, parallel corpus Greek-English
- EMEA Corpus
- ECDC Translation Memory
- DGT-Translation Memory
- DGT-Acquis
- EAC Translation Memory
- A parallel corpus collected from the European Constitution
- A parallel corpus of KDE4 localization files (v.2)
- European Central Bank parallel corpus
- OpenSubtitles2011
- SPC - Stockholm Parallel Corpora
- DGT-TM-2016
- OpenSubtitles
- QTLP English-Greek Corpus for the MEDICAL domain
- QTLP German-Greek Corpus for the MEDICAL domain
- QTLP Portuguese-Greek Corpus for the MEDICAL domain
- QTLP English-Greek Corpus for the AUTOMOTIVE domain
- QTLP Portuguese-Greek Corpus for the AUTOMOTIVE domain
- The JRC-Acquis Corpus, version 3.0
- FREL
- Text Corpus - EMEL
- Inlerlingual Perspectives
- aformes
- GLOSSOLOGIA
- Modern Greek Grammars (17th c. - middle 20th. c.)
- Civitas Gentium
- tekmirion. (issue 5)
- Conference Proceedings "Creative Writing" 1
- Conference Proceedings "Creative Writing" 2
- Official Journal of the European Union_oj4-ps-1
- Official Journal of the European Union_oj4-fd-2
- Official Journal of the European Union_oj4-pc-1
- Official Journal of the European Union_oj4-ss-1
- DICTA-SIGN corpus
- INTERA Corpus - the Greek-English part
- Greek-Bulgarian Bul-TM parallel corpus