Actualités du catalogue nº 53 (novembre 2021)
À la Une : Le modèle conceptuel IFLA LRM traduit en français
Un groupe de travail réunissant quatre experts du département des Métadonnées de la BnF a traduit le modèle conceptuel international IFLA LRM en français. Ce travail de plus de deux ans inclut la traduction des tableaux des entités, attributs et relations définis dans le modèle, des chapitres liminaires, des tâches utilisateurs ainsi que des chapitres de fin relatifs au traitement des agrégats, des identités bibliographiques, des schémas, etc. Le document est destiné à faire référence pour la communauté des bibliothécaires francophones.
Le modèle IFLA LRM est élaboré et maintenu au sein de l’IFLA par le Groupe de révision des modèles conceptuels bibliographiques (BCM Review Group). Sa publication en 2017 a fait aboutir la mise en cohérence en un seul modèle de ses trois prédécesseurs de la famille FR (FRBR, FRAD et FRSAD), publiés entre 1998 et 2009 et désormais obsolètes. Il s’agit de doter la profession d’un modèle de référence pour les données des catalogues, selon le principe entité-relation adopté dès la fin des années 1990 : le modèle exprime ainsi la structure sous-jacente des catalogues en définissant des entités (les choses que l’on décrit), identifiées par des attributs (leurs caractéristiques les plus distinctives) et liées entre elles par des relations.
Comment cette structuration entité-relation permet-elle de mieux servir les usagers ? C’est la question centrale du modèle, qui lui consacre deux chapitres (chapitres 3 et 6). Toutes les entités, comme d’ailleurs les attributs et relations, sont exprimées par rapport à des tâches utilisateur, et n’ont de sens que dans la mesure où ils répondent à l’un ou l’autre de ces besoins. En outre, la structuration du modèle fondée sur des liens signifiants entre des entités répond aux principes et aux enjeux du web sémantique. C’est pourquoi le modèle IFLA LRM est au cœur du programme national Transition bibliographique : sa traduction en français constitue donc une étape historique pour son appropriation par l’ensemble des acteurs du programme.
Sur le plan international, la présente traduction en français est le fruit d’un processus innovant de collaboration avec les rédactrices et le rédacteur du texte original, ce qui a permis de mettre au jour quelques erreurs dans le document anglais. Le groupe international de révision s’est emparé de l’occasion pour constituer une liste d’errata, enrichie des ajouts d’autres équipes de traduction. Le texte français est à jour de ces errata, en amont de leur publication officielle prévue pour la fin de l’année 2021. Au-delà des intérêts de la seule communauté francophone, il s’agit donc d’un exemple de collaboration à saluer entre communautés linguistiques, rendu possible grâce au cadre de l’IFLA, qui a toujours porté le multilinguisme au cœur de ses valeurs.
Focus : Le panier de notices est devenu le service Mes références
Le service Mes références centralise en une liste unique des références issues du Catalogue général et de Gallica. Il permet notamment de :
- mettre de côté des notices (bibliographiques ou d’autorité) pour les visualiser plus tard dans le Catalogue général ;
- ajouter des étiquettes pour classer les références ;
- trier et filtrer la liste des références selon plusieurs critères (date d’ajout, types de notices, étiquettes…) ;
- rebondir vers le Catalogue général en choisissant au préalable un type de notices (bibliographiques ou d’autorité) ;
- enregistrer des notices bibliographiques (ou documents), des marques pages et des recherches de Gallica.
Il est également possible, depuis le Catalogue général, d’ajouter des notices à Mes références à partir d’une liste de résultats ou d’une notice particulière.
Les usagers disposant précédemment d’un panier de notices retrouveront son contenu dans Mes références. Un mode d’emploi permettant de prendre en main ce nouveau service est par ailleurs à disposition dans le centre d’aide qui lui est dédié sur bnf.fr.
Une enquête est en cours pour étudier les améliorations qui pourraient être apportées au service. Si vous souhaitez y contribuer, que vous utilisiez ce service ou qu’il vous intéresse, signalez-vous via ce formulaire en ligne.
Veille catalogue : Créer des Œuvres et des Expressions pour Noemi
Des œuvres ont déjà été créées en masse depuis plusieurs années dans data.bnf.fr. Les titres des auteurs francophones des XIXe et XXe siècles ont ainsi été automatiquement extraits du Catalogue général et regroupés pour constituer des notices d’œuvres, à partir des notices de monographies imprimées (environ 1,5 millions d’œuvres textuelles, mixtes et iconographiques) et de notices de monnaies (près de 4 000 œuvres). Elles sont déjà disponibles à la consultation sur le site data.bnf.fr et seront rejointes par d’autres créations en masse : les œuvres d’auteurs anglophones des XIXe et XXe siècles, ainsi que les œuvres cinématographiques. Ces travaux de grande échelle sont complétés par des chantiers manuels pour les œuvres correspondant à des ouvrages plus anciens mais souvent réédités : le chantier « Œuvres fondatrices de la modernité » vise ainsi à créer des notices d’œuvres françaises publiées au XVIIIe siècle, très fréquemment rééditées jusqu’à nos jours avec d’importantes variantes de titres et de nombreuses traductions qui rendent difficile un traitement automatisé.
Les Expressions ne sont pas encore générées de la même manière, mais le traitement pour les obtenir est préparé par des corrections sur les zones de langue et les mentions d’édition. En effet, lorsque le texte d’une édition est enrichi ou modifié, le modèle IFLA LRM détermine qu’il s’agit d’une nouvelle Expression. Or les mentions d’édition sont actuellement dispersées dans des zones variées des notices bibliographiques. Une série de chantiers de corrections partiellement automatisés a été lancée pour identifier ces mentions, les structurer et les regrouper dans une même zone.
Ces chantiers de traitement de données anticipent ainsi les créations de nouvelles entités qui auront lieu surtout lors de la migration de l’ensemble des notices au format Intermarc du Catalogue général vers le nouveau format Intermarc Nouvelle Génération, pour la mise en production de Noemi.
Trois questions à… Julie Devanz-Fiorini sur le dépôt légal du son dématérialisé
Depuis décembre 2019, la BnF mène, en partenariat avec les producteurs de l’industrie musicale et le Syndicat national de l’édition phonographique, des expérimentations pour collecter les documents sonores dématérialisés, les décrire dans le Catalogue général et les proposer à la consultation dans les salles de la bibliothèque de recherche. Julie Devanz-Fiorini, coordinatrice du catalogage au service Son et membre de l’équipe du projet dépôt légal du son dématérialisé au département Son, vidéo et multimédia, présente les travaux en cours.
Que représente aujourd’hui le corpus de son dématérialisé disponible à la BnF et comment le traitez-vous ?
La mise en production du dépôt du son dématérialisé par flux est effective depuis décembre 2019. Cette filière d’entrée de documents sonores numériques natifs est le résultat d’un long travail d’instruction rendu possible grâce au partenariat étroit établi entre la BnF et Kantar media, gestionnaire de la base interprofessionnelle des producteurs phonographiques (BIPP) dont le Syndicat national des éditeurs phonographiques, le SNEP, est propriétaire.
Au 1er novembre 2021, la BnF a reçu de Kantar 8 740 albums. Chaque album doit être livré avec l’ensemble de ses fichiers sonores en format FLAC (Free Lossless Audio Codec) - une plage correspondant à un fichier -, un fichier de métadonnées au format DDEX restructuré par Kantar en XML, ainsi qu’un fichier JPEG correspondant au visuel de la pochette.
Ces 8 740 albums livrés par Kantar viennent d’Idol, distributeur indépendant de musique numérique de petite envergure en terme de volume (environ 4 000 nouveaux albums par an, soit 1% de la production dématérialisée). Ce flux reste limité (entre 70 et 100 albums livrés par semaine), mais il a permis de tester la robustesse de la chaîne d’entrée de ces documents dématérialisés et ses différentes étapes : contrôles automatiques et manuels des fichiers, création automatique des notices dans le Catalogue général, préservation des fichiers dans le magasin numérique de la bibliothèque SPAR (système de préservation et d’archivage réparti) et consultation des albums sur les postes audiovisuels de la salle P en bibliothèque de recherche du site François-Mitterrand. Cette consultation sera bientôt étendue à toutes les salles de recherche de la BnF via Gallica intra muros.
L’objectif est maintenant de recevoir les flux bien plus conséquents des majors (Universal, Warner, Sony). À titre d’information, Universal annonce distribuer 100 000 nouveaux albums en 2021. Ces flux massifs de données nécessitent d’importants développements informatiques.
Quelles sont les spécificités des notices correspondant à ce corpus ?
Tout d’abord, et contrairement au traitement manuel des documents sur support, ces notices sont générées automatiquement dans le Catalogue général par une conversion du format DDEX livré par Kantar vers le format Intermarc (lequel peut ensuite être converti en format Unimarc de diffusion) mise spécifiquement en place. Du fait des flux attendus très largement supérieurs au rythme de catalogage, du fait aussi de la richesse des métadonnées, la génération automatique des notices s’imposait.
Par ailleurs, ces notices sont structurées automatiquement en notice principale et sous-notices (notices analytiques) correspondant aux plages d’un album donné. Ce choix de description fine permet de restituer les nombreuses mentions de responsabilités (compositeurs, arrangeurs, librettistes, interprètes…) qui ne seraient pas indiquées en catalogage courant.
Cette structuration de l’album en sous-notices n’est pas sans entraîner quelques entorses aux règles du catalogage courant : c’est particulièrement le cas pour les albums de musique classique avec des œuvres à mouvements, de type symphonie, ou pour les opéras : en catalogage courant, la description bibliographique se fait à l’œuvre et non pas à la plage.
Kantar nous fournit en parallèle une base des artistes enrichie par des données de Musibrainz et de Wikidata. Les métadonnées des albums comportent des liens aux artistes décrits dans cette base, ce qui permet dans le meilleur des cas de faire un lien avec la notice d’autorité de la BnF, ou sinon d’avoir des informations (nom structuré, distinction entre personne et collectivité, dates biographiques…) qui permettront de générer des notices d’autorité élémentaires.
Comment peut-on récupérer ces données présentes au Catalogue général ?
L’ensemble du corpus est déjà identifiable dans le Catalogue général : en saisissant le terme « dlsondemat » dans l’encart de recherche simple, on trouve les notices issues du flux Idol. Ces notices peuvent ainsi être récupérées via le service de transfert de notices en ligne (les paniers) ou l’export CSV. Elles peuvent également être importées en masse par les services Z39.50 ou SRU en recherchant « dlsondemat » via le critère bib.anywhere. Vu leur nombre important, ces notices ne seront pas diffusées dans les produits bibliographiques mensuels pour tenir compte des contraintes des utilisateurs et de leur SGB.
La publication dans la Bibliographie nationale des notices issues du dépôt légal du son dématérialisé est en cours d’instruction. Les premiers versements feront l’objet de numéros spécifiques.
Le saviez-vous ? Le signalement des revues françaises en ligne est désormais enrichi et valorisé par l’import d’un lien vers Mir@bel
De création récente, la sous-zone 321 $v du format Intermarc bibliographique est utilisée dans les notices de revues électroniques françaises pour fournir le lien vers la page de la revue sur le site Mir@bel. Le Catalogue général bénéficie ainsi d’informations actualisées et surtout complémentaires de celles enregistrées par le Centre ISSN France dans le cadre de sa mission d’identification des publications en série françaises : type d’accès aux contenus (libre ou restreint, durée de la barrière mobile), accès au texte intégral, sommaires, résumés, états de collection, politique de publication et d’auto-archivage, liens à d’autres bases recensant des revues scientifiques sur la base de critères de qualité ou de libre accès (DOAJ par exemple). Ces données résultent de la veille documentaire effectuée par le Réseau Mir@bel et de la mise en place d’un processus de récupération automatique.
Le dispositif Mir@bel va bien au-delà du seul domaine français. Le Centre ISSN France y apporte néanmoins sa contribution en signalant dans le Catalogue général les nouveaux périodiques électroniques français répertoriés dans la plateforme et en leur attribuant un identifiant international. Le chargement dans le Catalogue général de liens vers Mir@bel renforce ainsi un écosystème qui réunit de nombreux acteurs nationaux et internationaux (éditeurs, Réseau Sudoc-PS, HAL, Sherpa-Romeo, Centre international de l’ISSN, etc.) au service d’objectifs communs : accroître la visibilité sur le web des revues scientifiques, valoriser les contenus accessibles en ligne et améliorer de manière collaborative la qualité des données.
Exemple de la revue électronique Bulletin de la société géologique de France dans le Catalogue général de la BnF et sur Mir@bel
En pratique : Rechercher les ISBN et les EAN par lots
En pratique, la recherche avancée permet d’interroger jusqu’à 100 ISBN ou EAN simultanément : dans les menus déroulants encadrant le champ de recherche par mots, l’utilisateur doit sélectionner « Données éditoriales, ISBN, ISSN, etc. » et « Un des mots » puis saisir les ISBN (avec ou sans les tirets), séparés uniquement par un espace entre eux.
Une fois la liste de résultats obtenue, les notices peuvent être exportées depuis cette dernière au format tabulaire (CSV), sous forme de fichier à intégrer dans un SGB (ISO 2709) ou au moyen des autres exports existants (PDF, TXT ou envoi par courriel).
À noter : l’API SRU offre également la possibilité de rechercher par ISBN-10, 13 ou par EAN avec le critère bib.fuzzyISBN.
Signalement de ressources : Évolutions des données de la BnF en janvier 2022
Au 1er janvier 2022, la BnF fait évoluer ses données pour refléter les évolutions du format UNIMARC et améliorer leur structuration. Ces évolutions portent sur les titres ajoutés par le catalogueur, les relations de provenance ou de possession, ainsi que les référentiels des codes d’écriture et des types de ressources continues. Consulter la synthèse des évolutions prévues, avec des indications sur la façon de mettre à jour les données rétrospectivement.
.
Publications
Feuille de route sur la politique du ministère de la Culture concernant les données, les algorithmes et les codes sources
La feuille de route du ministère de la Culture pour sa politique des données et contenus culturels s’inscrit dans le cadre de la politique publique de la donnée demandée par la circulaire du Premier ministre du 27 avril 2021. Le document expose les enjeux liés à la donnée et les finalités recherchées, présente les outils et moyens transverses en faveur de l’ouverture, du partage et de l’exploitation des données tout en fixant les actions prioritaires concrètes à mener ainsi que la gouvernance et le pilotage mis en place pour en assurer la mise en œuvre. Consulter la feuille de route « Données et contenus culturels » (version 1 du 15 septembre 2021).
Manuel UNIMARC autorités réactualisé
Le Manuel UNIMARC : format des données d’autorité, disponible sur le site transition-bibliographique.fr, a été remanié pour offrir aux utilisateurs une information plus accessible et complète. Le PDF unique correspondant à la traduction française de 2004 a ainsi été scindé en autant de PDF que de zones et la liste complète des zones du format international a été intégrée, avec les liens vers les documents en anglais lorsque ceux-ci sont disponibles en ligne et non encore traduits en français. Cette page est mise à jour régulièrement en fonction des évolutions du format international validées par le Permanent UNIMARC Committee (PUC).
Rencontres
6e journée du groupe Systèmes & Données de la Transition bibliographique (le 3 décembre 2021 à la BnF et en retransmission)
Cette journée propose de découvrir l’entité Expression dans le modèle IFLA LRM et son intérêt pour les utilisateurs. Elle comporte également la présentation d’outils mis à disposition des bibliothèques pour avancer dans la Transition bibliographique.
En chiffres
Depuis 2012, la BnF contribue à l’accroissement du Registre international de l’ISSN à raison de 9 500 notices par an en moyenne. Entre janvier et octobre 2021, ce sont déjà 9 879 ISSN qui ont été attribués à des ressources continues françaises.
En savoir plus sur la lettre d’information Actualités du catalogue