Les métadonnées de préservation numérique

Problématique

La pérennisation ne porte pas uniquement sur des questions d’organisation et de stratégie, de formats de fichiers ou des supports sur lesquels enregistrer l’information. Il s’agit également de décrire le document numérique pour assurer sa traçabilité et connaître :
  • son identifiant, et le contenu intellectuel auquel il correspond;
  • quel(s) est (sont) le(s) fichier(s) qui le compose(nt), et leurs caractéristiques techniques;
  • quelles sont sa structure et son organisation, en particulier lorsqu’il est constitué de plusieurs fichiers;
  • le contexte dans lequel il a été produit ou reçu à la BnF;
  • l’historique des opérations effectuées sur le document, ainsi que les agents (humains ou logiciels) qui les ont réalisées.
Cet aspect du problème est assuré par les métadonnées de préservation, qui accompagnent chaque paquet d’informations dans le système SPAR.

Formats de métadonnées utilisés dans SPAR

La BnF utilise deux formats principaux pour décrire ses paquets d’informations : METS et PREMIS.

METS

Il est utilisé comme format conteneur. Son rôle est de regrouper toutes les métadonnées d’un document numérique dans un fichier unique, et de référencer et organiser les fichiers d’un document à la manière d’une reliure numérique. Il permet enfin de rattacher les descriptions bibliographiques, techniques ou d’historique au niveau concerné (fichier, page, paquet d’informations…).

En savoir plus

PREMIS

PREMIS constitue un cœur de métadonnées permettant de renseigner les informations techniques de base sur le paquet d’informations et les fichiers qui le composent, ainsi que sur l’historique des opérations effectuées sur tout ou partie du paquet et les agents (humains ou logiciels) qui les ont réalisés.

METS et PREMIS sont deux standards de référence en matière de métadonnées du document numérique. Dans cette optique, la BnF participe à la maintenance évolutive de ces standards en tant que membre du METS Editorial Board et du PREMIS Editorial Committee.

En savoir plus

Autres formats utilisés

Ces deux standards sont complétés, pour les informations techniques spécifiques à certains types d’objets, par des métadonnées techniques ; les informations de contenu intellectuel ne sont pas jugées essentielles à la préservation, et sont donc exprimées sous forme de Dublin Core, l’identifiant ARK de la notice bibliographique étant enregistré pour obtenir davantage de précisions si nécessaire.

En savoir plus

Complémentarité des formats METS et PREMIS dans SPAR

METS et PREMIS : choix nécessaires

METS est un format extrêmement souple, ce qui nécessite de documenter les choix d’implémentation – ou profil METS – effectués par l’institution.

Ces choix portent en particulier sur :

  • les sections utilisées (presque toutes sont facultatives) ;
  • le nom de nos groupes de fichiers ;
  • les types de cartes de structure utilisés (physique, logique) ;
  • les niveaux de granularité dans la carte de structure ;
  • la structure des identifiants internes au METS.

En particulier, il y a beaucoup de façons possibles d’utiliser METS et PREMIS en conjonction, bien que des bonnes pratiques existent.

En savoir plus

Implémentation de METS et PREMIS dans SPAR

La figure ci-dessus résume les choix effectués dans l’utilisation de METS en conjonction avec PREMIS.

Processus de création des métadonnées de préservation dans SPAR

Ce METS est généré en plusieurs étapes :
  • lors de la création d’un SIP, le fichier METS qui comprend les informations de structure du paquet et des informations récupérées de systèmes extérieurs : identifiant d’origine, description bibliographique, opérations précédant l’entrée dans SPAR;
  • lors de la génération de l’AIP, le METS est enrichi de métadonnées techniques issues de l’analyse des fichiers, d’un identifiant ARK, et de l’ensemble des opérations de génération de l’AIP;
  • Lors de la finalisation de l’AIP, le METS est également indexé en RDF dans une base de données pour pouvoir être retrouvé et comparé avec d’autres paquets par le biais d’une interrogation.

Le cycle de vie des métadonnées de préservation dans SPAR est résumé ci-dessous :

Le profil METS générique pour les SIP donne davantage de précisions sur les exigences de SPAR sur les METS qu’il reçoit.