ΔΗΜΙΟΥΡΓΙΑ ΜΕΤΑΔΕΔΟΜΕΝΩΝ
1 Εισαγωγή
Αυτός ο οδηγός ασχολείται με τα μεταδεδομένα κατά τη διάρκεια της δημιουργίας των σε μια βιβλιοθήκη ή, γενικότερα, στη δημιουργία και ορισμό μιας ψηφιακής συλλογής. Ο σκοπός αυτού του οδηγού είναι να διερευνήσει εν συντομία τις ερωτήσεις:
Τι είναι τα μεταδεδομένα;
Σε τι χρησιμοποιούνται τα μεταδεδομένα;
Ποια είναι η διαδικασία δημιουργίας μεταδεδομένων;
Τα μεταδεδομένα υπάρχουν παντού. «Τα μεταδεδομένα διαδίδονται στα συστήματα πληροφοριών και έρχονται σε πολλές μορφές. [...] Τα μεταδεδομένα είναι το κλειδί για τη λειτουργικότητα των συστημάτων που διατηρούν το περιεχόμενο, επιτρέποντας στους χρήστες να βρίσκουν αντικείμενα που τους ενδιαφέρουν, να καταγράφουν βασικές πληροφορίες για αυτά και να μοιράζονται αυτές τις πληροφορίες με άλλους.» (Jenn Riley, Understanding Metadata NISO, 2017)
2 Τι είναι τα μεταδεδομένα;
Σκεφτείτε πώς οι έμποροι αποθηκεύουν πληροφορίες σχετικά με τα προϊόντα τους και τους πελάτες τους. Οι εργοδότες σχετικά με τους υπαλλήλους τους και τις λειτουργίες τους · οι οργανώσεις σχετικά με εκδηλώσεις που διαχειρίζονται · τα ερευνητικά ιδρύματα σχετικά με τις τάσεις και τα αξιοσημείωτα άτομα στην περιοχή τους · τις βιβλιοθήκες, αρχεία και μουσεία σχετικά με το υλικό που κατέχουν και τηρούν. Τις κυβερνήσεις για τους πολίτες τους, τους συμμάχους τους και τους εχθρούς τους - όλα αυτά είναι μεταδεδομένα.
Τα μεταδεδομένα, οι πληροφορίες που δημιουργούμε, αποθηκεύουμε και κοινοποιούμε στις περιγραφές, μας επιτρέπουν να αλληλεπιδρούμε με αυτά τα πράγματα για να αποκτήσουμε τη γνώση που χρειαζόμαστε. Ο κλασικός ορισμός είναι κυριολεκτικός, βασισμένος στην ετυμολογία της ίδιας της λέξης - τα μεταδεδομένα είναι «δεδομένα σχετικά με τα δεδομένα». Με αυτόν τον ευρύ ορισμό, θα μπορούσε κανείς να αναμένει ότι τα μεταδεδομένα θα μπορούσαν να βρεθούν παντού και όντως έτσι είναι.
Πράγματι, το 2013 ο όρος αυτός εντάχτηκε στο λεξιλόγιο των ΗΠΑ μέσω της μεγάλης δημοσιότητας που δόθηκε από τα ΜΜΕ για την συλλογή πληροφοριών από την Εθνική Υπηρεσία Ασφαλείας για εγχώριες τηλεφωνικές κλήσεις, συμπεριλαμβανομένου του χρόνου και της τοποθεσίας που ξεκίνησε, της διάρκεια και του αριθμού που εκλήθη.
Τα μεταδεδομένα χρησιμοποιούνται για να διευκολύνουν και να υποστηρίζουν την εύρεση, την ταυτοποίηση, την οργάνωση των πόρων και την ανταλλαξιμότητα των ίδιων των δεδομένων καθώς και την ανταλλαξιμότητα του πόρου ή των πόρων που αντιπροσωπεύουν. Τα μεταδεδομένα καταγράφουν επίσης και παρέχουν σημαντικές λεπτομέρειες για τους πόρους με βάση τα συμφραζόμενα, καθώς δεν είναι όλοι οι πόροι περιγραφόμενοι.
2.1 Τύποι μεταδεδομένων
Υπάρχουν πολλά διαφορετικά είδη μεταδεδομένων. Στον κόσμο των ψηφιακών αντικειμένων τα μεταδεδομένα χωρίζονται συνήθως σε 3 έως 5 κατηγορίες:
- Διαχειριστικά (διοικητικά) μεταδεδομένα , συμπεριλαμβανομένων:
- Μεταδεδομένα δικαιωμάτων (π.χ. δικαιώματα πνευματικής ιδιοκτησίας και πληροφορίες χρήσης)
- Τεχνικά μεταδεδομένα (δηλαδή, τεχνικές λεπτομέρειες σχετικά με το αντικείμενο και την εμφάνισή του, όπως τη μορφή αρχείου, το μέγεθος του αρχείου και τον τρόπο ανοίγματος, πρόσβασης και χρήσης του
- Μεταδεδομένα διατήρησης (δηλαδή, ένα αρχείο καταγραφής της σειράς ενεργειών που έχουν ληφθεί για ένα αντικείμενο προκειμένου να διασφαλιστεί η μακροζωία και η βιωσιμότητά του)
- Τα περιγραφικά μεταδεδομένα περιγράφουν έναν πόρο, το περιεχόμενό του, τα χαρακτηριστικά αναγνώρισής του και την «πληρότητα»
- Τα δομικά μεταδεδομένα περιγράφουν πώς τα κομμάτια ενός αντικειμένου ταιριάζουν μεταξύ τους και πώς υπάρχει ένα αντικείμενο σε σχέση με άλλα αντικείμενα
3 Εργαλεία δημιουργίας μεταδεδομένων
3.1 Σχήμα
Ένα σχήμα μεταδεδομένων είναι μια λίστα στοιχείων ή καθορισμένων σημείων δεδομένων που χρησιμοποιούνται για τη λήψη πληροφοριών σχετικά με έναν πόρο. Ορισμένα από αυτά τα σημεία δεδομένων ενδέχεται να περιλαμβάνουν τίτλο, αναγνωριστικό, όνομα δημιουργού ή ημερομηνία.
3.2 Πρότυπα
Τα πρότυπα είναι τα εργαλεία που μας λένε πώς να συμπληρώσουμε καθένα από τα στοιχεία δεδομένων σε ένα σχήμα. Υπάρχουν τρεις τύποι προτύπων:
3.2.1 Πρότυπα του περιεχομένου
Τα πρότυπα του περιεχομένου περιγράφουν τη χρήση κάθε στοιχείου ή ποιος τύπος πληροφορίας πηγαίνει και που. Δίνουν επίσης οδηγίες για τον καλύτερο τρόπο καταγραφής ή μεταγραφής αυτών των πληροφοριών: Από πού πρέπει να προέρχονται αυτές οι πληροφορίες, ποια είναι η καλύτερη πηγή πληροφοριών, ποια στοιχεία πρέπει να απαιτούν τη χρήση προτύπων τιμών δεδομένων και εάν ναι, ποια πρότυπα παράστασης των τιμών πρέπει να χρησιμοποιούνται.
3.2.2 Πρότυπα παράστασης δεδομένων
Τα πρότυπα παράστασης δεδομένων είναι λίστες τυποποιημένων όρων θεμάτων, όρων είδους, ονομάτων κ.λπ. Παραδείγματα τέτοιων προτύπων δεδομένων περιλαμβάνουν ελεγχόμενα λεξιλόγια, όπως οι επικεφαλίδες θεμάτων βιβλιοθήκης του Κογκρέσου και πρότυπα κωδικοποίησης ή μορφοποίησης όπως το ISO 8601 που καθορίζει τον τρόπο που πρέπει να παρουσιάζονται οι ημερομηνίες.
3.2.3 Πρότυπα δομής δεδομένων
Υπάρχουν πρότυπα δομής δεδομένων (XML, RDF κ.λπ.) που μας λένε πώς να κωδικοποιήσουμε και να δομήσουμε την εγγραφή μεταδεδομένων ώστε να διασφαλίσουμε την αναγνωσιμότητα του από μηχανές. Είναι σημαντικό να σημειωθεί ότι υπάρχουν δύο κύριοι χρήστες μεταδεδομένων: άνθρωποι και μηχανές. Τυχόν μεταδεδομένα που δημιουργείτε πρέπει να είναι κατανοητά και στα δύο.
3.3 Βέλτιστες πρακτικές
Οι βέλτιστες πρακτικές καθοδηγούν ή καθορίζουν την επιλογή και τη χρήση ενός συγκεκριμένου σχήματος μεταδεδομένων, ποιο υποσύνολο στοιχείων μέσα σε αυτό το σχήμα θα χρησιμοποιηθεί για να συμπεριλάβει ένα προφίλ μεταδεδομένων για χρήση στην περιγραφή μιας συγκεκριμένης κλάσης ή συλλογής αντικειμένων. Οι βέλτιστες πρακτικές χρησιμεύουν επίσης για: 1) τον καλύτερο προσδιορισμό ή την αποσαφήνιση στο πλαίσιο ενός δεδομένου έργου ή οργανισμού της χρήσης κάθε στοιχείου μεταδεδομένων. και 2) την ξεκάθαρη χωρίς αμφισβητήσεις χρήση συγκεκριμένων προτύπων περιεχομένου, δεδομένων και δομής δεδομένων.
3.4 Ποιότητα μεταδεδομένων
Κατά τη δημιουργία ή την αξιολόγηση μεταδεδομένων, είναι σημαντικό να ρωτήσετε:
- Ακρίβεια: Τα δεδομένα που καταγράφονται είναι σωστά και πραγματικά;
- Πληρότητα: Έχουν καταγραφεί όλα τα σχετικά δεδομένα;
- Συνοχή: Τα δεδομένα έχουν εισαχθεί με συνέπεια; Γίνεται χρήση του ίδιου συνόλου στοιχείων μεταδεδομένων για την περιγραφή όλων των πόρων στη συλλογή σας; Τα δεδομένα εισάγονται στην ίδια μορφή;
- Διαλειτουργικότητα: Είναι τα δεδομένα αναγνώσιμα από μηχανή; Μπορούν τα μεταδεδομένα σας να μετεγκατασταθούν και να κατανοηθούν εύκολα από άλλο σύστημα; Μπορούν να ενσωματωθούν με άλλα σύνολα μεταδεδομένων ή συλλογές;
4 Το σχήμα Dublin Core Metadata Element Set
4.1 Ιστορικό
Το σχήμα Dublin Core Metadata Element Set είναι ένα από τα απλούστερα και πιο ευρέως χρησιμοποιούμενα σχήματα μεταδεδομένων. Αρχικά αναπτύχθηκε για να περιγράψει διαδικτυακούς πόρους, χρησιμοποιείται για να περιγράψει μια ποικιλία φυσικών και ψηφιακών πόρων.
Το Dublin Core αποτελείται από 15 βασικά στοιχεία μεταδεδομένων, ο λεγόμενος πυρήνας. Αυτός ο «εξειδικευμένος» πυρήνας περιλαμβάνει πρόσθετα στοιχεία μεταδεδομένων που παρέχουν μεγαλύτερη δυνατότητα συγκεκριμενοποίησης και λεπτομέρεια στην καταγραφή.
Οι ορισμοί κάθε στοιχείου μεταδεδομένων είναι ενσωματωμένοι σε αυτό το βασικό πρότυπο - όπως το πρότυπο εγγενούς περιεχομένου - και δηλώνουν τι είδους πληροφορίες πρέπει να καταγράφονται πού και πώς. Αυτά τα στοιχεία των δεδομένων συσχετίζονται με πρότυπα τιμών δεδομένων, όπως το λεξιλόγιο τύπου DCMI και οι κωδικοί γλώσσας ISO 639, κ.λπ.
4.2 Πίνακας Dublin Core Metadata Element Set
Στοιχείο | Χρήση | Πιθανά πρότυπα τιμής δεδομένων |
---|---|---|
Title (Τίτλος ) | Ένα όνομα που δίνεται στον πόρο. | |
Subject (Θέμα) | Το θέμα του πόρου. | Τίτλοι θεμάτων βιβλιοθήκης του Κογκρέσου (LCSH) |
Description (Περιγραφή) | Ένας λογαριασμός του πόρου. | |
Creator (Δημιουργός) | Μια οντότητα που είναι κυρίως υπεύθυνη για την παραγωγή του πόρου. | Αρχείο αρχής ονόματος βιβλιοθήκης του Κογκρέσου (LCNAF) |
Publisher (Εκδότης) | Μια οντότητα υπεύθυνη για τη διάθεση του πόρου. | |
Contributor (Συνεισφέρων) | Μια οντότητα υπεύθυνη για τη συνεισφορά στον πόρο. | Αρχείο αρχής ονόματος βιβλιοθήκης του Κογκρέσου (LCNAF) |
Date (Ημερομηνία) | Ένα σημείο ή χρονική περίοδος που σχετίζεται με ένα συμβάν στον κύκλο ζωής του πόρου. | W3CDTF |
Type (Τύπος) | Η φύση ή το είδος του πόρου. | Όροι μεταδεδομένων DCMI |
Format (Μορφή) | Η μορφή αρχείου, το φυσικό μέσο ή οι διαστάσεις του πόρου. | Τύποι μέσων διαδικτύου (MIME) |
Identifier (Αναγνωριστικό) | Μια σαφής αναφορά στον πόρο μέσα σε ένα δεδομένο πλαίσιο. | |
Source (Πηγή) | Ένας σχετικός πόρος από τον οποίο προέρχεται ο περιγραφόμενος πόρος. | |
Language (Γλώσσα) | Μια γλώσσα του πόρου. | ISO 639 |
Relation (Σχέση) | Ένας σχετικός πόρος. | |
Coverage (Κάλυψη) | Το χωρικό ή χρονικό θέμα του πόρου, η χωρική δυνατότητα εφαρμογής του πόρου ή η δικαιοδοσία υπό την οποία ο πόρος είναι σχετικός. | Θησαυρός Γεωγραφικών Ονομάτων (TGN) |
Rights (Δικαιώματα) | Πληροφορίες σχετικά με τα δικαιώματα που διατηρούνται μέσα και πάνω από τον πόρο. |
5 Διαδικασία δημιουργίας μεταδεδομένων
5.1 Βήμα πρώτο
Κατά την προετοιμασία για να περιγράψετε τους πόρους σας, υπάρχουν ορισμένες ερωτήσεις που θα θέλατε να λάβετε υπόψη:
Τι περιγράφεις; Περιγράφετε ένα φυσικό αντικείμενο, ένα ψηφιακό αντικείμενο, μια ψηφιακή αναπαράσταση ενός φυσικού αντικειμένου;
Τι είδους πληροφορίες θέλετε να καταγράψετε; Ποιο είναι το κοινό μου; Ποιες πληροφορίες χρειάζονται για τον προσδιορισμό του πόρου; Ποιες πληροφορίες χρειάζονται για να τις προσαρμόσουν σωστά; Πώς θέλω οι άνθρωποι να το βρουν ή να αλληλεπιδράσουν με αυτό; Πώς περιμένω να το αναζητήσουν ή να το ανακαλύψουν; Πώς περιμένω να το χρησιμοποιήσω; Πώς περιμένω από άλλους να το χρησιμοποιήσουν τώρα και στο μέλλον; Ποιες πληροφορίες απαιτούνται για την επικοινωνία ποιος την κατέχει, ποιος μπορεί να τις χρησιμοποιήσει και σε ποιο βαθμό;
5.2 Βήμα δεύτερο
Καθώς αρχίζετε να απαντάτε στις ερωτήσεις που παρουσιάζονται στο πρώτο Βήμα, απαριθμήστε τις πληροφορίες που θα θέλατε να συμπεριλάβετε ως σημεία δεδομένων, π.χ. τίτλο, θέμα, δικαιώματα πρόσβασης κ.λπ. Για παράδειγμα, εάν θέλετε να επικαλύψετε εικόνες σε χάρτη, θα θελήσετε να καταγράψετε δεδομένα συντεταγμένων. Αυτή είναι η λίστα επιθυμιών των μεταδεδομένων σας.
5.3 Βήμα τρίτο
Εξετάστε τις περιγραφικές πληροφορίες ή τα μεταδεδομένα που μπορεί να έχετε ήδη: Ποια στοιχεία ή τι είδους πληροφορίες καταγράφονται ή παρουσιάζονται εκεί; Λείπουν πληροφορίες σχετικά με τους πόρους σας; Υπάρχουν πληροφορίες που θα ήταν δύσκολο να βρεθούν ή να δημιουργηθούν;
5.4 Βήμα τέταρτο
Βρείτε το «ελάχιστο χρυσό κανόνα» σας. Προσδιορίστε ποιες πληροφορίες είναι απαραίτητες για τη διευκόλυνση της ανακάλυψης, της ταυτοποίησης και για να δώσετε επαρκές πλαίσιο, αλλά όχι περισσότερο. Αυτό που είναι ακριβώς το ελάχιστο χρυσό στο χώρο του έργου σας εξαρτάται από τους στόχους του έργου σας και τους διαθέσιμους πόρους.
5.5 Βήμα πέμπτο
Οριστικοποιήστε τη λίστα των σημείων δεδομένων. Επιλέξτε να κωδικοποιήσετε αυτήν τη λίστα ως δικό σας σχήμα μεταδεδομένων ή αντιστοιχίστε την σε ένα υπάρχον σχήμα, όπως το Dublin Core.
5.6 Βήμα έκτο
Αποφασίστε εάν θέλετε να χρησιμοποιήσετε πρότυπα αξίας δεδομένων (ελεγχόμενα λεξιλόγια, θησαυρούς, πρότυπα κωδικοποίησης ή μορφοποίησης). Εάν ναι, ποια πρότυπα θα ισχύουν για ποια πεδία; Εναλλακτικά, μπορείτε να δημιουργήσετε τα δικά σας πρότυπα αξίας δεδομένων, όπως, ένα λεξιλόγιο θεμάτων που αφορά το θέμα ή τη συλλογή πόρων ή μια ελεγχόμενη λίστα ονομάτων. Καταγράψτε τις αποφάσεις σας ως τις βέλτιστες πρακτικές σας.