- Actualités Professionnelles /
- Bibliothèque de l'Arsenal /
- Brèves de la BnF /
- Département des Manuscrits
Nouvel échantillon de données sur Mandragore
Dans le cadre de réflexions sur les données de Mandragore, la base des enluminures des manuscrits de la BnF, un nouvel échantillon de données vient d’être mis en ligne sur le site BnF API et jeux de données.
Réalisé à l’occasion du stage professionnel d’une apprentie bibliothécaire au département des Manuscrits, il donne accès à un corpus de huit manuscrits entièrement segmentés, avec l’emplacement des enluminures sur les pages numérisées et l’indexation localisée des personnes et objets identifiables sur ces enluminures.
La base Mandragore est le premier outil informatique de description des manuscrits à avoir été développé à la BnF. Créée il y a 30 ans, mise en ligne en 2003, elle doit prochainement faire l’objet d’une mise à niveau (intellectuelle et graphique). La manière de visualiser les enluminures sur la page est l’un des enjeux forts de cette refonte, pour lequel ce jeu de données ouvre quelques pistes intéressantes.
L’échantillon participe également à des travaux de préfiguration de nouveaux services de recherche d’images par apprentissage machine (machine learning), pour lequel il pourrait servir de base d’apprentissage pour les enluminures médiévales.
Comme l’ensemble des métadonnées de la BnF, ce jeu de données est placé sous licence ouverte etalab et librement réutilisable.
Jeu de données : échantillon segmenté d’enluminures de Mandragore