Les métadonnées de préservation numérique
Problématique
- son identifiant, et le contenu intellectuel auquel il correspond;
- quel(s) est (sont) le(s) fichier(s) qui le compose(nt), et leurs caractéristiques techniques;
- quelles sont sa structure et son organisation, en particulier lorsqu’il est constitué de plusieurs fichiers;
- le contexte dans lequel il a été produit ou reçu à la BnF;
- l’historique des opérations effectuées sur le document, ainsi que les agents (humains ou logiciels) qui les ont réalisées.
Formats de métadonnées utilisés dans SPAR
La BnF utilise deux formats principaux pour décrire ses paquets d’informations : METS et PREMIS.METS
Il est utilisé comme format conteneur. Son rôle est de regrouper toutes les métadonnées d’un document numérique dans un fichier unique, et de référencer et organiser les fichiers d’un document à la manière d’une reliure numérique. Il permet enfin de rattacher les descriptions bibliographiques, techniques ou d’historique au niveau concerné (fichier, page, paquet d’informations…).
PREMIS
PREMIS constitue un cœur de métadonnées permettant de renseigner les informations techniques de base sur le paquet d’informations et les fichiers qui le composent, ainsi que sur l’historique des opérations effectuées sur tout ou partie du paquet et les agents (humains ou logiciels) qui les ont réalisés.METS et PREMIS sont deux standards de référence en matière de métadonnées du document numérique. Dans cette optique, la BnF participe à la maintenance évolutive de ces standards en tant que membre du METS Editorial Board et du PREMIS Editorial Committee.
Autres formats utilisés
Ces deux standards sont complétés, pour les informations techniques spécifiques à certains types d’objets, par des métadonnées techniques ; les informations de contenu intellectuel ne sont pas jugées essentielles à la préservation, et sont donc exprimées sous forme de Dublin Core, l’identifiant ARK de la notice bibliographique étant enregistré pour obtenir davantage de précisions si nécessaire.
Complémentarité des formats METS et PREMIS dans SPAR
METS et PREMIS : choix nécessaires
METS est un format extrêmement souple, ce qui nécessite de documenter les choix d’implémentation – ou profil METS – effectués par l’institution.
Ces choix portent en particulier sur :
- les sections utilisées (presque toutes sont facultatives) ;
- le nom de nos groupes de fichiers ;
- les types de cartes de structure utilisés (physique, logique) ;
- les niveaux de granularité dans la carte de structure ;
- la structure des identifiants internes au METS.
En particulier, il y a beaucoup de façons possibles d’utiliser METS et PREMIS en conjonction, bien que des bonnes pratiques existent.
Implémentation de METS et PREMIS dans SPAR
La figure ci-dessus résume les choix effectués dans l’utilisation de METS en conjonction avec PREMIS.
Processus de création des métadonnées de préservation dans SPAR
Ce METS est généré en plusieurs étapes :- lors de la création d’un SIP, le fichier METS qui comprend les informations de structure du paquet et des informations récupérées de systèmes extérieurs : identifiant d’origine, description bibliographique, opérations précédant l’entrée dans SPAR;
- lors de la génération de l’AIP, le METS est enrichi de métadonnées techniques issues de l’analyse des fichiers, d’un identifiant ARK, et de l’ensemble des opérations de génération de l’AIP;
- Lors de la finalisation de l’AIP, le METS est également indexé en RDF dans une base de données pour pouvoir être retrouvé et comparé avec d’autres paquets par le biais d’une interrogation.
Le cycle de vie des métadonnées de préservation dans SPAR est résumé ci-dessous :
Le profil METS générique pour les SIP donne davantage de précisions sur les exigences de SPAR sur les METS qu’il reçoit.