faqs

ορισμοί

Με τον όρο Γλωσσικοί Πόροι (ΓΠ) και Γλωσσικές Τεχνολογίες (ΓΤ) αναφερόμαστε σε σύνολα γλωσσικών δεδομένων και στα εργαλεία που χρησιμοποιούνται για την επεξεργασία τους.

Διακρίνουμε τις εξής κατηγορίες:

  • πόροι πρωτογενούς περιεχομένου
    •   πόροι ψηφιακού / ψηφιοποιημένου λόγου, όπως γραπτά κείμενα (π.χ. ψηφιοποιημένα βιβλία, κείμενα από διαδικτυακούς κόμβους, εφημερίδες, σώματα κειμένων κτλ.), ηχογραφήσεις προφορικού λόγου (π.χ. συνεντεύξεις, ραδιοφωνικές εκπομπές κτλ.),
    •   βιντεοσκοπήσεις (π.χ. τηλεοπτικές εκπομπές, ειδικές συλλογές με εκφράσεις προσώπου, χειρονομίες κτλ.),
    •   εικόνες (π.χ. ψηφιακές ή ψηφιοποιημένες φωτογραφίες με τις λεζάντες τους κτλ.
  • πόροι επεξεργασμένου υλικού
    •  διαφόρων ειδών επισημειώσεις σε κείμενα, ήχο και πολυμεσικά δεδομένα που έχουν δημιουργηθεί αυτόματα ή με το χέρι (π.χ. μορφοσυντακτικά επισημειωμένα κείμενα, μεταγραφές ηχητικών αρχείων, επισημειωμένα αρχεία βίντεο κτλ.)
  • πόροι αναφοράς
    •  διάφοροι τύποι οργάνωσης της γνώσης για τη γλώσσα (π.χ. λίστες λέξεων, λεξικά, θησαυροί κτλ.), οι οποίοι μπορούν να χρησιμοποιηθούν για την καλύτερη οργάνωση, επεξεργασία και μελέτη των πόρων πρωτογενούς περιεχομένου
  • εργαλεία/εφαρμογές γλωσσικής τεχνολογίας
    • εργαλεία και ολοκληρωμένες εφαρμογές που επιτελούν διάφορους τύπους γλωσσικής επεξεργασίας (π.χ. στοίχιση πολύγλωσσων κειμένων, μορφολογική επισημείωση, λημματοποίηση, συντακτική ανάλυση, εξόρυξη γνώσης κτλ.)
    • εργαλεία παρουσίασης/προβολής των δεδομένων (π.χ. ολοκληρωμένα περιβάλλοντα προβολής κειμένων, συλλογών πολυμεσικών δεδομένων, αποτελεσμάτων επεξεργασίας κτλ.).

Κεντρικός συσσωρευτής είναι το κεντρικό Αποθετήριο της Υποδομής, βασική αρμοδιότητα του οποίου είναι

  • η συγκομιδή των μεταδεδομένων από τα λοιπά Αποθετήρια,
  • η προβολή τους σε ενιαίο κατάλογο και
  • η διάθεση των Γλωσσικών Πόρων στα Μέλη του Δικτύου και στο ευρύ κοινό.

Γλωσσικές τεχνολογίες (ΓΤ) είναι συστοιχίες υπολογιστικών εργαλείων που σκοπό έχουν την πολυεπίπεδη ανάλυση, επεξεργασία, επισημείωση, επαύξηση και μετασχηματισμό Γλωσσικών Δεδομένων.

Υπηρεσίες γλωσσικής επεξεργασίας (ΥΓΕ) είναι οι Υπηρεσίες που επιτρέπουν τη διαδικτυακή χρήση Γλωσσικών Πόρων και Τεχνολογιών καθώς και των εφαρμογών τους.

Πάροχος (πόρων) είναι κάθε φυσικό ή νομικό πρόσωπο που διαθέτει Γλωσσικούς Πόρους ή/και Τεχνολογίες ή/και Υπηρεσίες γλωσσικής επεξεργασίας στην Υποδομή. 

Γλωσσικά δεδομένα είναι ψηφιακό γλωσσικό περιεχόμενο, κάθε μορφής και μέσου, δομημένο ή αδόμητο.

Τα Εργαλεία Γλωσσικής Ανάλυσης είναι υπολογιστικά εργαλεία με τη μορφή λογισμικού, με σκοπό την

  • ανάλυση,
  • επεξεργασία, και
  • επισημείωση γλωσσικών δεδομένων.

συμμετοχή στο δίκτυο

Tο έργο CLARIN (http://www.clarin.eu) είναι μία πανευρωπαϊκής εμβέλειας προσπάθεια να συγκεντρωθούν, να συντονιστούν και, τελικά, να διατεθούν στην ερευνητική κοινότητα γλωσσικοί πόροι, τεχνολογίες και υπηρεσίες (ΓΠΤΥ) σε όλες τις γλώσσες, μέσω μιας διαδικτυακής Ερευνητικής Υποδομής που θα περιλαμβάνει και σχετικά γλωσσικά εργαλεία.

Η πρωτοβουλία αυτή απευθύνεται κυρίως στην ερευνητική κοινότητα αλλά και στο ευρύ κοινό. Οργανωτικά έχει τη μορφή πανευρωπαϊκού δικτύου ερευνητικών κέντρων, και στοχεύει να παράσχει

  • πρόσβαση σε πόρους, υπηρεσίες και γλωσσικά εργαλεία για την επεξεργασία των ΓΠΤΥ
  • τεκμηρίωση των ΓΠΤΥ
  • συντονισμό της δημιουργίας, αρχειοθέτησης, διαχείρισης και πρόσβασης στους ΓΠΤΥ
  • ενημέρωση και εκπαίδευση σχετικά με τη χρήση της γλωσσικής τεχνολογίας.

 

Το clarin:el είναι το ελληνικό σκέλος της υποδομής CLARIN. Περισσότερες πληροφορίες μπορείτε να βρείτε εδώ.

 

Φορείς που επιθυμούν να διαθέσουν τους πόρους τους μέσω της ερευνητικής υποδομής clarin:el πρέπει να συμπληρώσουν την Αίτηση Μέλους στο Δίκτυο clarin:el. 

Για να υποβάλετε την Αίτηση Μέλους, παρακαλούμε να συμπληρώσετε το σχετικό έντυπο και να στείλετε το έντυπο (σαρωμένο ως αρχείο PDF) στον Συντονιστή του Δικτύου clarin:el.

 

Τα φυσικά πρόσωπα που επιθυμούν να διαθέσουν μέσω της ερευνητικής υποδομής ψηφιακό περιεχόμενο, γλωσσικούς πόρους ή/και εργαλεία γλωσσικής τεχνολογίας που έχουν αναπτύξει, μπορούν να εκδηλώσουν ενδιαφέρον συμπληρώνοντας και αποστέλλοντας τη σχετική αίτηση στον Συντονιστή του Δικτύου.

 

διάθεση πόρων

Για να αποθηκεύσει κανείς τους πόρους του στην υποδομή πρέπει να είναι εγγεγραμμένο μέλος κάποιου από τα αποθετήρια της υποδομής και να έχει δικαιώματα τεκμηριωτή στο συγκεκριμένο αποθετήριο (μετά από αίτηση στον διαχειριστή του αποθετηρίου). 

Η διαδικασία περιγραφής και αποθήκευσης πόρων περιλαμβάνει τα εξής βήματα (αναλυτική περιγραφή υπάρχει εδώ):

  • Αρχικά, πρέπει να γίνει η τεκμηρίωση του πόρου, δηλαδή, η προσθήκη των μεταδεδομένων περιγραφής του. Αυτό μπορεί να γίνει με δύο τρόπους:
    • μέσω του περιβάλλοντος τεκμηρίωσης (metadata editor) που παρέχει η υποδομή. Το περιβάλλον τεκμηρίωσης οδηγεί τον τεκμηριωτή να περιγράψει τον πόρο, επισημαίνοντάς του τα υποχρεωτικά πεδία.  Εφόσον έχουν συμπληρωθεί όλα τα υποχρεωτικά πεδία, αποθηκεύεται η περιγραφή.  
    • με φόρτωση υπαρχόντων αρχείων τεκμηρίωσης πόρων σε μορφή xml. Πρόκειται για περιγραφές πόρων οι οποίες έχουν δημιουργηθεί εκτός περιβάλλοντος και βρίσκονται σε μορφή αρχείων xml. Η υποδομή ελέγχει τη συμβατότητα των περιγραφών με το σχήμα τεκμηρίωσης της υποδομής και, εφόσον είναι συμβατές, τις αποθηκεύει.
  • Μετά την αποθήκευση των μεταδεδομένων, το επόμενο στάδιο είναι η αποθήκευση των ίδιων των δεδομένων του πόρου. Στο στάδιο αυτό, ο τεκμηριωτής αναρτά τα δεδομένα του σε ένα ορισμένο σημείο (endpoint). Το endpoint εξυπηρετεί όλους τους τεκμηριωτές του εκάστοτε αποθετηρίου λειτουργώντας ως τοπικό σημείο στο οποίο τοποθετούν τα αρχεία των δεδομένων τους, και από το οποίο αυτά μεταφορτώνονται στην υποδομή. Τα αρχεία δεδομένων πρέπει να είναι σε συμπιεσμένη μορφή τύπου 'zip', 'tar.gz', 'gz', 'tgz', 'tar', 'bzip2', ή 'bz2'. 
  • Στο τελικό στάδιο, ο τεκμηριωτής ενημερώνεται με μήνυμα email ότι ολοκληρώθηκε η διαδικασία αποθήκευσης των δεδομένων.

 

χρήση εφαρμογής

Προκειμένου να επεξεργαστούμε έναν δικό μας πόρο (δηλαδή, πόρο που δεν είναι στην υποδομή) με ένα εργαλείο γλωσσικής τεχνολογίας που υπάρχει ως διαδικτυακή υπηρεσία (δηλαδή, εργαλείο που το τρέχουμε διαδικτυακά), πρέπει πρώτα να επιλέξουμε την υπηρεσία που επιθυμούμε και ακολούθως να ανεβάσουμε τον πόρο αυτό στην υποδομή, ακολουθώντας τα εξής βήματα:

 

  1. Από τον κεντρικό κατάλογο της υποδομής (www.inventory.clarin.gr) επιλέγουμε browse 
  2. Φιλτράρουμε τον κατάλογο των διαθέσιμων πόρων για να επιλέξουμε την υπηρεσία που επιθυμούμε
    • με πρώτο κριτήριο τον τύπο του πόρου (Filter by > Resource Type = Tool Service), για να επιλέξουμε μόνο τα εργαλεία/υπηρεσίες και 
    • με δεύτερο κριτήριο το αν είναι διαδικτυακή υπηρεσία (Filter by > Processing service = yes), για να περιορίσουμε τα αποτελέσματα μόνο στις διαδικτυακές υπηρεσίες 
  3. Επιλέγουμε την υπηρεσία που επιθυμούμε από τον κατάλογο
  4. Στη νέα σελίδα εμφανίζεται η περιγραφή της υπηρεσίας. Επιλέγουμε Upload and process για να ξεκινήσουμε τη διαδικασία μεταφόρτωσης του πόρου μας 
  5. Στη νέα σελίδα συμπληρώνουμε τη φόρμα περιγραφής του πόρου που θέλουμε να ανεβάσουμε στην υποδομή για να τον επεξεργαστούμε.  ΠΡΟΣΟΧΗ: ο πόρος πρέπει να είναι μέχρι 2ΜΒ και να είναι σε μορφή αρχείου zip!
  6. Επιλέγουμε save and start processing 
    • ΣΗΜΕΙΩΣΗ: εάν είμαστε απλοί χρήστες, οι πόροι που ανεβάζουμε καθώς και το αποτέλεσμα της  επεξεργασίας θα διαγραφούν από την υποδομή μετά από 2 ημέρες. Εάν είμαστε τεκμηριωτές,  αποθηκεύονται στο αποθετήριό μας (Ιδρυματικό ή Αποθετήριο Φιλοξενούμενων Πόρων. Αν είμαστε απλοί χρήστες αλλά θέλουμε να διατηρηθούν οι πόροι μας, μπορούμε να κάνουμε αίτηση για να γίνουμε τεκμηριωτές. 
  7. Η υποδομή μας ενημερώνει για την πορεία της επεξεργασίας και όταν αυτή ολοκληρωθεί μας στέλνει mail το οποίο μας παραπέμπει σε σχετικό υπερσύνδεσμο όπου βρίσκεται ο επεξεργασμένος πόρος.  

 

τεχνικά ζητήματα

Μπορείτε να αναρτήσετε στην υποδομή μόνο τα μεταδεδομένα ενός πόρου, ενώ ο ίδιος ο πόρος να διατίθεται από άλλο σημείο (π.χ. από άλλο URL, από τον κάτοχο του πόρου, κτλ). Ωστόσο, οι διαδικτυακές υπηρεσίες γλωσσικής επεξεργασίας που παρέχει η υποδομή clarin:el δεν μπορούν να επεξεργαστούν δεδομένα που δεν είναι αποθηκευμένα στην υποδομή. Αν λοιπόν θέλετε να χρησιμοιήσετε τις υπηρεσίες αυτές, είναι απαραίτητο να αποθηκεύσετε δεδομένα και μεταδεδομένα στην υποδομή clarin:el. 

Για να μπορούν οι πόροι σας να είναι κατάλληλοι για επεξεργασία από τις υπηρεσίες γλωσσικής επεξεργασίας του clarin:el, πρέπει τα ίδια τα δεδομένα αλλά και τα μεταδεδομένα τεκμηρίωσής τους να πληρούν ορισμένες προδιαγραφές. 

Όσον αφορά τα ίδια τα δεδομένα, πρέπει να είναι αποθηκευμένα στο αποθετήριο του φορέα σας σε μορφή συμπιεσμένου αρχείου. ​ 

Όσον αφορά τα μεταδεδομένα, πρέπει να συμπληρώσετε τα ακόλουθα υποχρεωτικά πεδία με τις προτεινόμενες κατά περίπτωση τιμές: 

Linguality type: Monolingual ή Bilingual 

  • Size: μέχρι 2 ΜΒ
  • Text Format (Mime type), κατά περίπτωση:
    • αν είναι text/plain και μονόγλωσσο, τότε στο πεδίο Conformance to standards best practices δεν βάζετε τίποτα 
    • αν είναι text/plain και δίγλωσσο, τότε στο πεδίο Conformance to standards best practices βάζετε MOSES
    • αν είναι application/x-tmx+xml, τότε στο πεδίο Conformance to standards best practices βάζετε TMX
  • Character encoding: UTF8
  • Licence: οποιοσδήποτε τύπος ανοικτής άδειας (βλ. σχετικά στις συχνές ερωτήσεις) υπό την προϋπόθεση ότι επιτρέπει παράγωγους πόρους (derivatives). 

Προτείνεται επίσης να συμπληρώνονται τα ακόλουθα πεδία μεταδεδομένων: 

  • domain, διότι ορισμένα εργαλεία έχουν βέλτιστη απόδοση σε συγκεκριμένους τομείς λόγω ανάλογης εκπαίδευσης,  
  • annotation,  διότι η πληροφορία είναι χρήσιμη στην είσοδο του εκάστοτε εργαλείου προκειμένου να περάσει στο επόμενο στάδιο επεξεργασίας. Σε αυτήν την περίπτωση πρέπει να συμπληρωθούν τα 
    • Annotation Type, και
    • Conformance to standards best practices (βλ. τις αντίστοιχες τιμές mimeType)
  • text type/text genre, για τη συμπλήρωση των οποίων επιλέγετε από μία αναδυόμενη λίστα τιμών ή προσθέτετε με ελεύθερο κείμενο τη δική του επιλογή. 

Σε περίπτωση που έστω και ένα από τα προαναφερθέντα υποχρεωτικά χαρακτηριστικά δεν είναι συμβατό με τις προδιαγραφές, τα γλωσσικά εργαλεία δεν μπορούν να επεξεργαστούν τον πόρο.
   

Οι οργανισμοί που είναι μέλη του δικτύου μπορούν να δημιουργήσουν, εάν το επιθυμούν, το δικό τους αποθετήριο, όπου θα αποθηκεύουν, θα τεκμηριώνουν, θα διαχειρίζονται και θα επιμελούνται τους πόρους τους. 

Στην περίπτωση αυτή, πρέπει να επικοινωνήσετε με τον Συντονιστή του Δικτύου και τον Τεχνικό Διαχειριστή της ΕΥ clarin:el, καθώς και να ορίσετε έναν Τεχνικό Υπεύθυνο ("Διαχειριστή Αποθετηρίου"), ο οποίος θα αναλάβει την εγκατάσταση του αποθετηρίου και τη διαχείριση των χρηστών. Περισσότερες πληροφορίες δίνονται στο εγχειρίδιο του διαχειριστή αποθετηρίου.

 

Υπηρεσίες υπολογιστικής υποστήριξης Υποδομής είναι οι υπηρεσίες 

  • έκδοσης μοναδικών χαρακτηριστικών (Persistent IDentifiers, PIDs),
  • πιστοποίησης και εξουσιοδότησης χρηστών (Authentication and Authorization Infrastructure, AAI),
  • αποθήκευσης, και
  • παροχής υπολογιστικής ισχύος για εκτέλεση διαδικτυακών υπηρεσιών.

Ο Κόμβος παροχής υπηρεσιών υπολογιστικής υποστήριξης παρέχει υπολογιστική ισχύ και αποθηκευτικό χώρο για τη διάθεση και εκτέλεση των Γλωσσικών Πόρων, Τεχνολογιών και Υπηρεσιών της Υποδομής. Παρέχει Υπηρεσίες πιστοποίησης και διαχείρισης χρηστών της Υποδομής και εξασφαλίζει τη συνεχή και απρόσκοπτη λειτουργία της Υποδομής.

Το Αποθετήριο Φιλοξενούμενων Πόρων φιλοξενεί (και διαθέτει στους χρήστες της υποδομής) πόρους που διατίθενται από παρόχους που δεν διατηρούν Αποθετήριο. Φιλοξενεί και διαθέτει προς συγκομιδή από τον Κεντρικό συσσωρευτή τα μεταδεδομένα των πόρων αυτών. Τέλος, παρέχει Υπηρεσίες διαχείρισης των χρηστών του.

Κάθε Ιδρυματικό Αποθετήριο φιλοξενεί και διαθέτει στους χρήστες τους πόρους του οικείου ιδρύματος, οι οποίοι διατίθενται με τις κατάλληλες άδειες διάθεσης. Φιλοξενεί τα μεταδεδομένα των πόρων του Ιδρύματος και τα διαθέτει προς συγκομιδή από τον Κεντρικό συσσωρευτή. Τέλος, παρέχει Υπηρεσίες διαχείρισης των χρηστών του.

Ο Κεντρικός Συσσωρευτής φιλοξενεί τον κεντρικό κατάλογο πόρων της Υποδομής, ο οποίος περιλαμβάνει πληροροφίες για όλους τους πόρους της υποδομής. Για να συγκεντρώσει τις πληροφορίες αυτές, ο Συσσωρευτής συγκομίζει τα μεταδεδομένα από τα τοπικά Αποθετήρια.

Επίσης, από κοινού με τη διαδικτυακή πύλη της Υποδομής φιλοξενεί τις υπηρεσίες νομικής και τεχνικής υποστήριξης.

νομικά ζητήματα

Τα πάσης φύσεως κείμενα, εφόσον είναι πρωτότυπα προστατεύονται ως έργα λόγου από την πνευματική ιδιοκτησία. Η ευρεία κυκλοφορία του υλικού φορέα (πχ το προεκλογική ή διαφημιστικό φυλλάδιο) σε καμία περίπτωση δε συνιστά μεταβίβαση των εξουσιών του περιουσιακού δικαιώματος της πνευματικής ιδιοκτησίας και ως εκ τούτου, για κάθε πράξη εκμετάλλευσης απαιτείται άδεια του αρχικού δημιουργού. Ωστόσο υπόκειται στις νόμιμες εξαιρέσεις/περιορισμούς που επιβάλλει ο νόμος, όπως ενδεικτικά την ιδιωτική αναπαραγωγή.

Οι άδειες του δημόσιου τομέα αποτελούν σημαντικό εργαλείο για τη διάθεση τεράστιων όγκων δεδομένων που έχουν παραχθεί από Δημόσιους Οργανισμούς.

Χρήσιμες πληροφορίες στα βασικά σχήματα αδειοδότησης καθώς και αναφορές στις συγκεγκριμένες άδειες μπορείτε να βρείτε εδώ 

http://en.wikibooks.org/wiki/Legal_framework_of_textual_data_processing_for_Machine_Translation_and_Language_Technology_research_and_development_activities/Licensing

Οι διατριβές καταρχήν ανήκουν στους δημιουργούς τους. Οι όροι χρήσης/διάθεσης των διατριβών προσδιορίζονται με βάση τη νομοθεσία και τις σχετικές συμβατικές ρυθμίσεις μεταξύ αποθετηρίου και δημιουργού.

Η συγκεκριμένη άδεια (CC-BY) δεν θέτει περιορισμούς ως προς τους παράγωγους πόρους και την αδειοδότησή τους. Οπότε, μπορείτε να διαθέσετε τον παράγωγο πόρο με όποια άδεια επιθυμείτε. Εφόσον στον παράγωγο πόρο επιβιώνει ο πρωτότυπος πόρος (οπότε και διατίθεται μαζί με τον παράγωγο), τότε θα πρέπει να σεβαστείτε τις δεσμεύσεις της συγκεκριμένης άδειας, δηλαδή να κάνετε αναφορά στον πρωτότυπο πόρο σύμφωνα με τα οριζόμενα κυρίως στα 4b και 4c (https://creativecommons.org/licenses/by/3.0/legalcode).

Πάροχος άδειας χρήσης

Είναι το πρόσωπο που νομιμοποιείται να παράσχει την άδεια για έναν πόρο και που νομίμως την παρέχει. Ο πάροχος της άδειας χρήσης μπορεί να είναι άλλος από τον δημιουργό, τον διανομέα ή τον κάτοχο των δικαιωμάτων διανοητικής ιδιοκτησίας. Ο πάροχος έχει τα απαραίτητα δικαιώματα ή την άδεια να αδειοδοτήσει τον πόρο και είναι αυτός που πράγματι αδειοδοτεί τον πόρο που εισάγεται στο δίκτυο clarin:el. Αν ο πάροχος δεν είναι κάτοχος των δικαιωμάτων διανοητικής ιδιοκτησίας του πόρου, οφείλει να έχει αποκτήσει τα δικαιώματα ή την άδεια από τον κάτοχο. Μπορεί επίσης να έχει ένα συμφωνητικό διάθεσης με έναν Διαθέτη/Διανομέα που διαθέτει τον πόρο σύμφωνα με όρους που αναγράφονται στην συγκεκριμένη άδεια. Η αναφορά στον δημιουργό, χωριστά από την αναφορά στον πάροχο ενδέχεται να αποτελεί μέρος της άδειας διάθεσης του πόρου. 

 

Διανομέας 

Το φυσικό ή νομικό πρόσωπο που κατέχει τα δικαιώμτα διάθεσης/διανομής του πόρου. Οι όροι και τα δικαιώματα διανομής περιγράφονται στο συμφωνητικό διάθεσης/διανομής.Ο διανομέας στις περισσότερες περιπτώσεις έχει μια περιορισμένη άδεια διανομής του πόρου για λογαριασμό του παρόχου ή του κατόχου των δικαιωμάτων διανοητικής ιδιοκτησίας και δεν έχει το δικαιώμα να δώσει στους χρήστες του πόρου άδειες που δεν περιλαμβάνονται στο συμφωνητικό διάθεσης (π.χ. να επιτρέψει χρήσεις του πόρου που δεν ορίζονται στο συμφωνητικό διάθεσης).  

 

Κάτοχος των δικαιωμάτων διανοητικής ιδιοκτησίας

Το φυσικό ή νομικό πρόσωπο που κατέχει τα πλήρη δικαιώματα διανοητικής ιδιοκτησίας επί του πόρου. Ενδέχεται να είναι άλλος από τον δημιουργό, ο οποίος μπορεί να ανέθεσε τα δικαιώματα αυτά στον κάτοχο (π.χ. συγγραφέας-δημιουργός αναθέτει τα δικαιώματά του/της στον εκδότη, που είναι πλέον ο κάτοχος αυτών). Επίσης, μπορεί να είναι άλλος από τον διανομέα, ο οποίος διαθέτει τον πόρο εντός του δικτύου clarin:el με μια συγκεκριμένη άδεια.

Ανοιχτές άδειες είναι οι τυποποιημένες, μη ανακλητές άδειες δημόσιας χρήσης που επιτρέπουν στους δημιουργούς να διαμοιράζουν το έργο τους στο κοινό. Οι ανοιχτές άδειες εφαρμόζονται  σε πάσης φύσεως περιεχόμενο, δεδομένα και λογισμικό.

Κάθε άδεια επιτρέπει στον εκάστοτε χρήστη να χρησιμοποιήσει το αδειοδοτούμενο έργο με τους ειδικούς όρους που τη διέπουν. Τέτοιοι όροι μπορούν να αφορούν στην υποχρέωση αναφοράς της πηγής, στην απαγόρευση ή μη της εμπορικής χρήσης, στην απαγόρευση ή μη της δημιουργίας παράγωγων έργων, καθώς και στην υποχρέωση ή μη περαιτέρω διανομής του έργου (και των παραγώγων αυτού) με τους όρους της αρχικής άδειας. 

Οι πιο σημαντικές από τις ανοικτές άδειες είναι

 

Καθένα από τα κείμενα αυτά αποτελεί έργο λόγου και ως τέτοιο υπόκειται σε αποκλειστικά δικαιώματα τρίτων (δημιουργού, εκδότη, τρίτου δικαιούχου κοκ). Η εκ μέρους σας περαιτέρω χρήση εξαρτάται από την άδεια με την οποία διατίθεται ο εκάστοτε πόρος. Το γεγονός ότι αυτοί βρίσκονται στο διαδίκτυο δε σημαίνει αυτομάτως ότι διατίθενται ελεύθεροι προς περαιτέρω χρήση. Κατα συνέπεια θα πρέπει να διερευνηθούν οι όροι διάθεσης των πόρων αυτών.
Επιπλέον και δεδομένης της φύσης κάποιων πόρων, εφόσον πρόκειται για οπτικοακουστικά αρχεία με ομιλίες, συνεντεύξεις, φωτογραφίες κτλ., είναι πολύ πιθανό να προκύψουν και ζητήματα που ανακύπτουν από το δικαίωμα στην εικόνα ή/και στην προσωπικότητα του ατόμου.
Η μοναδική περίπτωση που ενδεχομένως να υφίσταται το δικαίωμα αυτοδικαίως για περαιτέρω χρήση συγκεκριμένων κειμένων, είναι για όσα αποτελούν δημόσια έγγραφα, τα οποία πλέον λογίζονται ως εξ ορισμού ανοιχτά. Εν προκειμένω κάτι τέτοιο θα μπορούσε να ισχύει για τους πόρους από τη Βουλή των Ελλήνων.
Ωστόσο η ύπαρξη πολλαπλών δικαιωμάτων και πολλαπλών δικαιούχων καθιστά επιβελημένη την περαιτέρω διερεύνηση του καθεστώτος που διέπει τους πόρους αυτούς ανάλογα με την πηγή.

Χρήσιμες πληροφορίες για τους διάφορους τύπους δεδομένων του Δημόσιου Τομέα καθώς και τους σχετικούς περιορισμούς χρήσης μπορείτε να βρείτε εδώ: 

http://en.wikibooks.org/wiki/Legal_framework_of_textual_data_processing_for_Machine_Translation_and_Language_Technology_research_and_development_activities/Public_Sector_Information#Recommendation_1

 

Καταρχήν, ως έγγραφα δημόσιας διοίκησης ορίζουμε όλα τα επίσημα κείμενα που έχουν εκδοθεί ή αποτελούν αντικείμενο διαχείρισης από τους φορείς του δημοσίου τομέα, όπως ενδεικτικά νομοθετικά, διοικητικά ή δικαστικά κείμενα, μελέτες, πρακτικά, στατιστικά στοιχεία και λοιπά δεδομένα κοκ. Τα έγγραφα αυτά καταρχήν διέπονται από την αρχή της εξ ορισμού ανοιχτότητας και τη δυνατότητα περαιτέρω χρήσης. Ωστόσο είναι δυνατόν υπό προϋποθέσεις να περιέχουν ή να διέπονται και τα ίδια από δικαιώματα πνευματικής ιδιοκτησίας ή/και να ισχύουν οι διατάξεις για την προστασία των προσωπικών δεδομένων, της ιδιωτικότητας ή να διέπονται από καθεστώς εμπιστευτικότητας.

Τα οπτικοακουστικά αρχεία διέπονται πλήρως από το νόμο περί προστασίας της πνευματικής ιδιοκτησίας (αφορά στους δημιουργούς που τεκμαίρονται ότι είναι οι σκηνοθέτες) και των συγγενικών δικαιωμάτων (αφορά στους παραγωγούς). Στην περίπτωση που τα αρχεία έχουν υποστεί επεξεργασία, ισχύουν τα πνευματικά δικαιώματα του αρχικού δημιουργού, τα συγγενικά δικαιώματα του παραγωγού και επιπλέον τα πνευματικά δικαιώματα  του διενεργούντος την επεξεργασία. Κατά συνέπεια ο τρόπος διάθεσης αυτών εναπόκειται στη διακριτική ευχέρεια των δημιουργών, άλλως δικαιούχων των αρχείων αυτών.

Τα πρακτικά της Βουλής διέπονται από το καθεστώς των δημοσίων εγγράφων και ως εκ τούτου ισχύει και για αυτά η αρχή της εξ ορισμού ανοιχτότητας και η δυνατότητα περαιτέρω χρήσης, σε οποιαδήποτε μορφή και αν βρίσκονται. Ειδικά τώρα για τα οπτικοακουστικά αρχεία (video) που αφορούν σε συνεδριάσεις της Βουλής, εφόσον γίνονται από τη δημόσια τηλεόραση ισχύουν καταρχήν τα ίδια, με τη διαφορά ότι υπάρχει επιπλέον το ηθικό δικαίωμα του σκηνοθέτη, ως δημιουργού του αρχείου αυτού. Τέλος, δικαιώματα που αφορούν στην προσωπικότητα του ατόμου ενδεχομένως να ισχύουν σε σχέση με τα πρόσωπα που απεικονίζονται στα οπτικοακουστικά αρχεία.  

Τα παλαιότερα κείμενα, όπως μεσαιωνικά και πρώιμα ελληνικά κείμενα ανήκουν καταρχήν στο δημόσιο τομέα και ως εκ τούτου είναι ελεύθερα πνευματικών δικαιωμάτων. Εφόσον όμως αποτελούν περιεχόμενο ιδιωτικής συλλογής και δημοσιευτούν για πρώτη φορά μετά τη λήξη της προστασίας τους, σε αυτήν την περίπτωση ισχύει συγγενικό δικαίωμα των ιδιωτών αυτών διάρκειας 25 ετών.  Επιπλέον, τέτοιου είδους έργα πιθανόν να υπόκεινται και στην αυξημένη προστασία του νόμου για την πολιτιστική κληρονομιά και στις ενέργειες που αυτός επιβάλλει ανά κατηγορία έργου (πχ άδεια από ΥΠΠΟ, καταβολή τέλους κτλ). Σε κάθε περίπτωση, κάθε επιπλέον επεξεργασία, όπως ενδεικτικά, επιμέλεια, ψηφιοποίηση κοκ. συνιστά πνευματικό δικαίωμα και εφόσον έχουν τηρηθεί οι απαραίτητες διατυπώσεις (λήψη άδειας από τον δικαιούχο επί του αρχικού έργου κτλ), ο ενεργών την επιμέλεια, ψηφιοποίηση κτλ. διατηρεί όλα τα δικαιώματα επί της επιμέρους συμβολής του.