Architecture logicielle de SPAR
SPAR, le système de préservation numérique de la BnF s’inspire dans sa réalisation des entités du modèle fonctionnel de la norme OAIS. Rôles, objectifs et interactions de ces entités y sont définis, ce qui permet la spécification de modules aux fonctions claires.
Organisation générale des modules de SPAR
Les relations entre les modules de SPARsont clairement définies grâce à la norme OAIS.Ils sont donc indépendants : les composants sont ainsi plus faciles à remplacer, assurant la pérennité des fonctions, et une distribution propice aux performances attendues.Modules Pré-versement
Ces modules, un par chaîne, effectuent les traitements nécessaires à la normalisation des données avant leur versement dans SPAR proprement dit. Les données et métadonnées soumises par le producteur ou extraites de systèmes externes (catalogues, annuaires, etc.) sont mises sur le modèle de SIP attendu par le système.
Module Versement
Ce module reçoit les données à verser (SIP) de la part des producteurs, ou du module Pré-versement si les données ont été préalablement mises en forme. Une fois le versement validé au regard de l’accord de qualité de service, les données, éventuellement transformées pour les besoins de la préservation, sont empaquetées pour l’archivage (AIP) avant d’être remises au stockage.Module Stockage
Ce module assure les opérations liées au stockage des fichiers numériques qui lui sont confiés sous forme de paquets à archiver (AIP). Il est une couche d’abstraction des mécanismes et des systèmes de stockage vis-à-vis des autres modules. Il garantit l’intégrité des données, et assure l’adéquation des modes de stockage aux exigences des producteurs et de la communauté des utilisateurs, en termes de performance et disponibilité.Module Gestion des données
Ce module assure les fonctions et services relatifs à l’indexation, la conservation et l’accès aux métadonnées, tant à l’Information de description, qui identifie et documente les paquets dans SPAR, qu’aux données administratives utilisées pour gérer le système.La solution technique choisie repose sur plusieurs entrepôts :
- L’entrepôt des documents de référence contient tous les manifestes METS des paquets d’information, et les schémas XML utilisés par le système.
- L’entrepôt Complet regroupe la plupart des métadonnées pour les recherches portant sur toutes les collections, à des fins de planification des opérations de préservation.
- L’entrepôt Sélection couvre les métadonnées pour des requêtes rapides, notamment pour le fonctionnement interne du système.
- L’entrepôt de référence contient les métadonnées communes à plusieurs paquets, et qui définissent les choix de préservation : descriptions des formats, des processus, exigences de chaque chaîne ou filière, etc.
L’avantage d’utiliser une même modélisation en RDF pour l’ensemble des métadonnées de SPAR est de permettre une grande liberté dans la construction des requêtes, indépendamment des solutions techniques et de l’évolution des besoins.
En savoir plus