PREMIS : PREservation Metadata Implementation Strategies
Principes de base de PREMIS
L’objet de PREMIS est de proposer une implémentation du modèle d’information OAIS sous la forme d’un dictionnaire de données. Contrairement à METS, PREMIS est donc spécifiquement centré sur la préservation et propose un ensemble précis de champs à renseigner pour faciliter la préservation d’un objet numérique. L’objectif de PREMIS est d’être neutre en termes techniques et vis-à-vis du domaine métier dans lequel l’objet à préserver se situe (musée, archives, bibliothèque, laboratoire de recherche…).
Bien qu’issu en grande partie du monde des bibliothèques, PREMIS a donc vocation à être applicable quel que soit le contexte ; d’autre part il ne contient pas de métadonnées techniques spécifiques à un type d’objet (image, son, audio, vidéo…) et laisse ces aspects à d’autres schémas de métadonnées spécialisés.
Modèle de données PREMIS
Le dictionnaire de données PREMIS est composé de quatre entités distinctes reliées entre elles.Au cœur du modèle de données se trouve l’Objet (Object) que l’on souhaite préserver. Il peut s’agit d’un fichier (file), d’une partie de fichier (bitstream), ou d’un ensemble de fichiers constituant une représentation (representation) d’une entité intellectuelle (intellectual entity), qui peuvent être reliés entre eux par des relations de tout à partie ou de dérivation.
Depuis la version 3, l’entité intellectuelle, jusque-là hors du périmètre de PREMIS, est désormais un type d’Objet à part entière.
Cette évolution répond au besoin de décrire des environnements (Environment), type particulier d’entités intellectuelles qui identifient des outils logiciels ou matériels nécessaires à la création, la modification et la restitution des objets numériques. Ces environnements pourront également faire l’objet d’une préservation sous forme d’une représentation spécifique.
Ces mêmes objets doivent ensuite être replacés dans l’historique des opérations qu’ils ont subies depuis leur création. Pour ce faire, PREMIS permet de décrire les interactions d’Agents (Agents) – personnes, organisations, ou logiciels – avec des Événements (Events) (c’est-à-dire des opérations de préservation).
Les Agents peuvent attribuer, ou se faire attribuer, les Droits (Rights) d’effectuer certaines opérations en fonction du statut juridique de l’Objet préservé, de la politique de l’établissement et des autorisations des ayants droit.
Une quatrième entité Droits vient donc s’intercaler entre les Objets sur lesquels elle porte et les Agents qui sont impliqués dans une déclaration de droits. Les déclarations de droits qui justifient les interdictions ou autorisations accordées peuvent être de trois natures : propriété intellectuelle (copyright), texte de loi (statute), convention avec des ayants droit (license).
Dictionnaire de données PREMIS
Pour décrire ces entités, PREMIS fournit une liste d’éléments nommés «unités sémantiques» (semantic units). Cette liste est hiérarchisée : ces unités peuvent être des «conteneurs» (semantic container) comprenant d’autres unités sémantiques, ou des «composants» (semantic component).
À chaque unité est attachée une cardinalité précisant si le champ est obligatoire ou optionnel, répétable ou non répétable. Pour chacune d’entre elles, des notes d’application donnent des bonnes pratiques d’utilisation.
Parmi les unités sémantiques courantes, on notera que les deux mécanismes de base sont :
- Les identifiants : PREMIS permet d’identifier un Objet, Agent, Déclaration de droit ou Événement particuliers (Identifiant de l’entité) et d’y faire référence depuis une autre entité (identifiant de l’entité en relation). Cela permet de mettre en œuvre les flèches présentes dans la figure ci-dessus.
- Les extensions : PREMIS permet, pour préciser des informations qui sortent de son périmètre, d’utiliser des extensions. C’est par exemple le cas de l’unité sémantique objectCharacteristicsExtension, qui permet de compléter la description PREMIS avec des schémas de métadonnées techniques.
Comment exprimer PREMIS
Le dictionnaire de données PREMIS est conçu pour être indépendant de toute problématique d’implémentation technique. Cependant, le PREMIS Editorial Committee met à disposition des utilisateurs deux modalités d’expression :- un schéma XML pour exprimer PREMIS en XML
- une ontologie OWL permettant d’exposer les métadonnées de préservation conformément aux principes du web sémantique.
PREMISà la BnF
La BnF, comme de nombreuses autres institutions, utilise PREMIS comme schéma XML imbriqué dans ses fichiers METS afin de décrire ses objets numériques, les événements qui les ont affectés et les agents impliqués. L’entité Rights n’est pas employée, l’implémentation des quatre entités n’étant pas obligatoire dans PREMIS.
PREMIS est utilisé dans SPAR, le système de préservation de la BnF, mais également comme format de métadonnées pour la numérisation afin de décrire le processus de production des documents numériques.