Ο πόρος του μήνα

Το Σώμα Κειμένων Parallel Global Voices είναι ένα σύνολο παράλληλων και μονόγλωσσων σωμάτων κειμένων που παρήχθησαν από τους πολύγλωσσους ιστότοπους Global Voices (https://globalvoices.org/), στους οποίους εθελοντές δημοσιεύουν και μεταφράζουν νέα και ειδήσεις από περισσότερες από 40 γλώσσες. Το αρχικό περιεχόμενο των ιστότοπων του Global Voices είναι διαθέσιμο από τους δημιουργούς και τους εκδότες τους με άδεια Creative Commons Αναφορά Δημιουργού. Το περιεχόμενο συλλέχθηκε με διαδικασία crawling τον Ιούλιο - Αύγουστο 2015 από ερευνητές της ομάδας Επεξεργασίας Φυσικής Γλώσσας του Ινστιτούτου Επεξεργασίας του Λόγου. Τα κείμενα και οι μεταφράσεις τους στοιχήθηκαν βάσει της πληροφορίας των σχετικών συνδέσμων. Μετά την παράλληλη στοίχιση των ζευγών κειμένων έγινε αυτόματη εξαγωγή των παράλληλων τμημάτων του κειμένου (παραγράφων, προτάσεων, τμημάτων προτάσεων). Τα αποτελέσματα της αυτόματης στοίχισης σε επίπεδο κειμένου και τμημάτων αυτού διατίθενται με άδεια Creative Commons Αναφορά Δημιουργού.

Η τεκμηρίωση του σώματος Parallel Global Voices βρίσκεται εδώ.