Pour rappel, tous les sites de la BnF sont fermés les mercredis 25 décembre et 1er janvier.
Actualités du catalogue nº 56 (juillet 2023)
À la Une – À la découverte des notices d’entités en UNIMARC
Constitué à partir du film Nosferatu le Vampire de Friedrich Wilhelm Murnau, dont l’année 2022 marquait le centenaire, le jeu de données respecte le code RDA-FR et les règles des différents formats UNIMARC tels que publiés à cette date. Il se compose de 215 notices d’entités Œuvre, Expression, Manifestation et Item, et est accompagné d’un lot de 191 notices d’autorité traditionnelles (personne, collectivité, matière…), pour lesquelles un catalogage par entités n’est pas encore possible dans le format UNIMARC. Ce jeu invite à expérimenter la manipulation et le traitement des notices d’entités dans les applications de catalogage et à imaginer leur exploitation dans les interfaces de consultation. Il permet en particulier de saisir toute la richesse des relations entre les différentes entités dans le modèle IFLA LRM, par exemple entre une œuvre et ses traductions, ses transpositions pour la jeunesse, ses adaptations cinématographiques ou en bande dessinée, ou encore avec les œuvres qu’elle a inspirées.
Les notices sont mises à disposition sur le site Zenodo aux formats texte, ISO 2709, MarcXchange, avec un encodage en UTF-8 ; elles sont accompagnées d’une documentation qui inclut notamment un fichier reprenant l’ensemble des notices sous forme d’une table de nœuds et de liens permettant de visualiser le jeu de données sous forme de graphe et de se lancer plus facilement dans l’analyse des relations. Depuis sa mise en ligne, le jeu de données a donné lieu à plusieurs expérimentations de la part d’éditeurs de SGB éditeurs de SGB et de professionnels .
Pour toute question ou pour porter vos remarques et suggestions à la connaissance du groupe Systèmes & Données, vous pouvez passer par le formulaire de contact de la page du site de la Transition bibliographique en utilisant le sujet « Utilisation du jeu de notices en UNIMARC conforme à IFLA LRM ».
N’hésitez pas à faire part de vos expérimentations, qui pourront être présentées lors de la prochaine journée « Métadonnées en bibliothèques », le 1er décembre 2023.
Focus – La Transition bibliographique en France en 2023
Un jalon important a été franchi avec la mise à disposition, fin 2022, d’un jeu de données composé d’un lot de notices d’entités au format UNIMARC conformes au code RDA-FR et au modèle IFLA LRM. Il permet de tester les nouvelles règles de catalogage et de s’assurer de leur compatibilité avec les systèmes existants, en offrant notamment aux éditeurs de SGB la possibilité d’expérimenter sur ces notices. Ce jeu de données est un élément clé pour faciliter la mise en place de la Transition bibliographique.
L’ontologie RDA-FR, en cours d’élaboration, transpose progressivement le contenu des chapitres publiés du code, selon le formalisme RDF/OWL. Cette ontologie permet de documenter les règles de catalogage dans un format technique, qui facilite l’intégration des données dans les systèmes informatiques des bibliothèques. Elle est destinée aux concepteurs de logiciels et aux développeurs qui doivent adapter leurs outils aux nouvelles normes. L’ontologie est donc un élément important pour assurer l’interopérabilité entre les différents systèmes informatiques.
Le projet de publication du code RDA-FR sous forme de site web, en remplacement des fichiers PDF actuellement diffusés sur le site de la Transition bibliographique, permettra aux professionnels des bibliothèques de consulter plus facilement les règles et de les appliquer dans leur travail quotidien. Il s’agira d’un outil visant à faciliter l’appropriation du nouveau standard par les bibliothécaires.
Concernant le processus de rédaction du code lui-même, une expérimentation est en cours sur la normalisation des entités Événement et Laps de temps, afin de proposer un cadre normatif (plus succinct) plutôt qu’une norme complète.
Enfin, une feuille de route est en cours d’élaboration. Elle formalisera les étapes de la Transition bibliographique pour les années 2024-2027, en rendant compte des différents chantiers en cours au sein de leur contexte national ou d’établissement. Cette démarche permettra de rendre visible la cohérence à l’œuvre dans les travaux en cours, menés avec les différents acteurs et partenaires (agences, bibliothèques, éditeurs de SGB, fournisseurs de métadonnées, etc.).
Veille catalogue – La Dewey, c’est clair !
À la BnF, la Dewey dépasse son rôle premier de classement des documents en rayon : conjointement avec Rameau, elle sert aussi à indexer au sujet les imprimés, le multimédia, le son et les images. C’est par ailleurs le seul accès sujet dont les publications en série (périodiques et collections éditoriales) disposent. La BnF est en outre la seule bibliothèque au monde à disposer d’un fichier autorité Dewey interrogeable par indice et par libellé via son Catalogue général, ce fichier contenant tous les éléments de la version électronique en ligne de la CDD, la WebDewey.
Depuis février 2023, le libellé Dewey est affiché dans les notices bibliographiques des monographies et des publications en série du Catalogue général. Il figure dans la zone des formats INTERMARC et UNIMARC réservée à la CDD, à savoir la 676, et se répercute dans l’affichage au format public. Auparavant, seul y figurait l’indice, sur lequel il était nécessaire de cliquer pour afficher la notice d’autorité Dewey correspondante et prendre ainsi connaissance du libellé. Exemples de ce nouvel affichage : dans la notice de la monographie consacrée à l’aviatrice sportive Lucienne Saby et dans la notice du périodique Rock hebdo.
Le classement des résultats depuis une recherche Sujets A-Z a également été amélioré : les indices sont désormais présentés par ordre croissant.
Ces évolutions facilitent la recherche documentaire sur des thèmes élaborés avec la clé Dewey. Les contenus, plus lisibles, deviennent accessibles à une plus grande variété d’utilisateurs.
Trois questions à… Françoise Leresche sur l’évolution des métadonnées
À des postes très différents en bibliothèques municipale, universitaire ou à la BnF, Françoise Leresche a travaillé dans le domaine des métadonnées tout au long des quatre dernières décennies, qui ont été celles de la révolution de l’information. Avant de prendre sa retraite à la fin de l’année 2022, elle occupait le poste de chargée de normalisation documentaire au département des Métadonnées de la BnF et pilotait le groupe Normalisation du programme national Transition bibliographique.
Spécialiste française des métadonnées des catalogues, vous avez assuré plusieurs mandats électifs dans les instances de normalisation nationale (Afnor) et internationale (IFLA). Que retenez-vous de vos contributions aux travaux de ces instances ?
La normalisation accompagne les grandes mutations du monde. Certains congrès de l’IFLA ont ainsi marqué pour moi des étapes fondamentales dans la prise en compte de questions très actuelles.
D’un point de vue économique, c’est au congrès de l’IFLA à Paris en 1989 qu’a été soulevée la question du coût du catalogage pour les agences bibliographiques et des simplifications envisageables pour le réduire sans nuire aux services rendus aux utilisateurs. L’année suivante, le Séminaire sur les notices bibliographiques lançait à Stockholm le groupe de travail sur les Fonctionnalités requises des notices bibliographiques dont les travaux devaient aboutir en 1998 à la publication du Rapport final sur les FRBR. Au-delà des bases posées pour le modèle entités-relations, les tableaux de correspondance entre les tâches utilisateur et les éléments de données présents dans une notice sont toujours utiles aujourd’hui.
Mais ce sont surtout les technologies numériques qui ont fait irruption dans les travaux de la normalisation documentaire. C’est au congrès de l’IFLA à Barcelone en 1993 qu’internet et le web sont officiellement reconnus comme une réalité concernant directement les bibliothèques. Au congrès de Milan en 2009, c’est le web sémantique qui est au cœur des discussions, avec le lancement de la publication des documents normatifs (modèles, ISBD ou formats) sous forme d’ontologies et la définition d’alignements (par exemple entre l’ISBD et FRBR, puis entre l’ISBD et LRM). Le code RDA publié l’année suivante a l’ambition de fournir une structure de l’information bibliographique adaptée au web, en s’appuyant sur la modélisation entités-relations utilisée dans les modèles FRBR et FRAD.
Dans une démarche similaire du côté de l’ISO, la norme ISO 690 sur les références bibliographiques est par exemple régulièrement révisée pour prendre en compte tous les types de ressources en ligne, depuis les courriels dans les années 1990 jusqu’aux tweets et autres billets postés sur les réseaux sociaux, ou aux archives du web aujourd’hui. Dans les travaux de l’Afnor et de l’ISO, les orientations évoluent avec la part croissante de la documentation électronique et se concentrent sur la structure interne des ressources (et non plus sur leur présentation) et les métadonnées associées. En parallèle, les identifiants internationaux normalisés prennent de plus en plus d’importance.
Comment les bibliothèques ont-elles fait évoluer leurs règles de description pour s’adapter à ces nouvelles technologies ?
L’ISBD définissait les règles de description en vue d’une collaboration internationale dans le cadre du contrôle bibliographique universel (CBU), mais en se fondant à l’origine sur l’expérience des catalogues sur fiches encore omniprésents dans les bibliothèques – et sur une adéquation entre un type de contenu et une présentation matérielle. Les formats MARC (Machine Readable Cataloging) définis en parallèle étaient destinés d’abord à la production par les agences bibliographiques nationales de fiches diffusées auprès des bibliothèques. Or le passage aux échanges informatisés (et à la récupération de notices MARC à mesure de l’informatisation des catalogues) a remis en cause la pratique du catalogage à niveaux pour décrire les monographies en plusieurs volumes et les séries. Une révision de l’ISBD a été engagée dans les années 1980 pour rendre les notices autonomes (avec la description globale d’une part, et la description volume par volume d’autre part). Une nouvelle logique de dénomination des parties s’est progressivement imposée dans le catalogage des monographies, mais n’a cependant pas vraiment remis en cause la construction des points d’accès pour les notices d’autorité Titres uniformes : la construction hiérarchisée y est encore majoritaire. D’où une certaine distorsion dans les catalogues que le catalogage par entités met aujourd’hui en évidence.
Les règles de description ont connu une seconde évolution significative au début des années 2000, du fait de l’arrivée des ressources électroniques qui peuvent véhiculer et associer différentes formes de contenu. L’adéquation entre une présentation éditoriale et un type de contenu sur laquelle reposait la définition des différents ISBD spécialisés était rompue, et il fallait envisager une nouvelle articulation de ces deux aspects d’une ressource : la zone 0 de l’ISBD a ainsi été définie pour rendre compte de la Forme du contenu et du Type de médiation. En 2011, l’ISBD intégré a harmonisé les règles pour toutes les catégories de ressources publiées.
Quels sont les enjeux actuels de l’évolution des catalogues de bibliothèques ?
Aujourd’hui, c’est la nécessité pour les bibliothèques d’être présentes sur le web et de pouvoir répondre directement aux recherches des internautes qui impose une nouvelle structure de l’information bibliographique : passer des notices MARC à des données en RDF (modèle de description des ressources utilisé par le web pour en permettre un traitement automatique). La modélisation FRBR – et désormais LRM – définie par l’IFLA est l’outil privilégié pour cette évolution majeure. En ce qui concerne les règles de description, c’est RDA qui a engagé ce travail de réorganisation par entités des données bibliographiques, l’ISBD restant sur une définition de la « ressource » qui combine les quatre entités OEMI (Œuvre, Expression, Manifestation, Item).
La « LRMisation » des catalogues est ainsi un enjeu majeur, en catalogage courant avec RDA-FR et en reprise des données existantes. De la réussite de la transformation des notices existantes en notices d’entités conformes au modèle LRM dépendent les possibilités d’exploitation des données dans les interfaces de consultation et de navigation. Ainsi RDA et BIBFRAME sont-ils aujourd’hui limités par la prise en compte du poids des données existantes qu’il n’est pas envisagé de reprendre (par exemple les consignes d’application de RDA par la Bibliothèque du Congrès relatives à l’article initial dans les titres).
D’autre part, la mise en commun de l’identification des instances des entités qui constituent les différents aspects par lesquels on décrit et recherche une ressource (les œuvres et expressions qu’elle matérialise, les agents qui les ont créées, les sujets traités) permet de limiter les coûts du catalogage par le partage de celui-ci – ce qui semble une piste plus prometteuse que la simplification et l’allègement des données.
Enfin, la définition des ontologies est essentielle dans le contexte du web sémantique. L’ontologie RDA-FR est ainsi un jalon essentiel, pendant de la LRMisation des catalogues, pour assurer leur visibilité dans le web de données. Dans la perspective de l’interopérabilité avec d’autres communautés culturelles, elle doit veiller à ne pas se restreindre à la seule pratique des bibliothèques dans la définition des entités. Une ontologie unique n’est cependant pas indispensable : l’interopérabilité entre jeux de données est désormais assurée par les alignements entre ontologies d’une part, et par l’utilisation d’identifiants internationaux normalisés d’autre part – ces derniers permettant de déclarer identiques deux instances partageant le même identifiant.
Le saviez-vous ? – La BnF est impliquée dans un projet de portail national de l’édition accessible et adaptée.
On estime à moins de 10% la production éditoriale qui se trouve publiée sous une forme jugée « accessible » aux différents types de handicap. C’est la raison pour laquelle « l’exception handicap » introduite par la loi DADVSI de 2006 permet à des organismes habilités de réaliser des adaptations d’ouvrages (braille, agrandissements, textes lus, etc.) en exception au droit d’auteur (c’est-à-dire sans demander l’autorisation des auteurs ni leur verser de rémunération). La BnF contribue à ce dispositif en développant et en maintenant depuis 2010 la plateforme Platon, conçue à l’origine pour permettre aux éditeurs de transmettre aux organismes un fichier numérique de leurs ouvrages de façon sécurisée, et qui a vocation depuis 2018 à accueillir progressivement les fichiers adaptés réalisés par les différents organismes, à des fins d’échange entre eux. Parallèlement, la directive européenne sur l’accessibilité des biens et des services, qui doit entrer en vigueur en 2025, donne obligation aux éditeurs de publier leurs livres numérique sous une forme « nativement accessible ». Dans ce contexte, l’enjeu du portail en projet est triple :
- Constituer un catalogue public recensant à la fois la production éditoriale commercialisée par les éditeurs sous une forme accessible et les adaptations réalisées par des organismes habilités.
- Permettre aux bénéficiaires de l’exception handicap (toute personne empêchée « d’accéder à l’œuvre dans la forme sous laquelle l’auteur la rend disponible au public », du fait « d’une ou de plusieurs déficiences des fonctions motrices, physiques, sensorielles, mentales, cognitives ou psychiques ») d’avoir accès, sur authentification, aux ouvrages adaptés.
- Permettre à ces mêmes bénéficiaires de demander l’adaptation d’un ouvrage qui ne serait pas encore disponible à un niveau d’accessibilité correspondant à leur besoin.
Des groupes de travail réunissant l’ensemble des contributeurs (éditeurs, organismes, représentants des bénéficiaires…) seront réunis pour contribuer aux spécifications du portail. Un travail propre aux bibliothèques devrait être conduit afin de préciser le rôle qu’elles pourraient être amenées à jouer dans l’accompagnement des bénéficiaires finaux.
Publications
Ontologie RDA-FR en ligne
Dans le cadre du programme Transition bibliographique, l’objectif de l’ontologie RDA-FR est d’exprimer avec les technologies du web sémantique les entités, leurs attributs et leurs relations définies par le code de catalogage RDA-FR en conformité avec le modèle international IFLA LRM. L’ontologie RDA-FR permettra aux agences bibliographiques nationales et aux éditeurs de systèmes de gestion de bibliothèques de créer ou de diffuser dans un environnement web sémantique des données structurées conformément à ce code afin de faciliter leur exploitation par tous, au-delà des bibliothèques.
Les deux agences bibliographiques, la BnF et l’Abes, ont fait le choix de publier l’ontologie RDA-FR progressivement, par blocs de classes cohérents, au fur et à mesure de son élaboration. Rendez-vous sur le site dédié https://rdafr.fr/ pour découvrir l’ontologie elle-même, son profil d’application, comprendre les choix de modélisation et avoir accès aux fichiers source sur le compte GitHub de la Transition bibliographique.
Exigences pour l’implémentation d’ARK par les sous-autorités nommantes et autorités d’adressage BnF (nouvelle version)
La BnF attribue des identifiants ARK aux ressources qu’elle crée et préserve et préconise leur citation par cet identifiant. L’attribution et l’accès des usagers à la ressource identifiée par leur ARK, sont pour la plupart décentralisées : de nombreuses applications gèrent l’attribution d’identifiants (elles sont dites « sous-autorités nommantes ») ; d’autres - ou les mêmes - donnent accès à ces ressources (elles sont dites « autorités d’adressage »). Les exigences que ces applications doivent suivre, afin d’être considérées comme conformes à la spécification ARK et à la politique ARK de la BnF, sont récapitulées dans la version 3 de ce document.
Tuto TapIR pour le catalogage en EAD des archives et manuscrits (première parution)
TapIR (Traitement Automatisé pour la Production d’Instruments de Recherche) est l’outil de catalogage en EAD mis à disposition gratuitement par la BnF et destiné aux établissements impliqués dans le signalement de leurs collections d’archives et de manuscrits. Les consignes pour accompagner son utilisation au quotidien sont rappelées dans un tutoriel comportant une partie explicative sur TapIR et une autre sur XEditor, l’éditeur XML, ainsi que des fiches pratiques.
Téléchargeable, imprimable et mis à jour régulièrement, le Tuto TapIR est indispensable pour les campagnes de signalement dans le CCFr. Afin de préparer au mieux ces chantiers et d’exploiter ensuite les données produites, des fiches pratiques complètent ce kit de travail pour le catalogage des archives et manuscrits en EAD destiné à alimenter le Catalogue général des manuscrits (CGM) accessible en ligne dans le CCFr.
Rencontres
Datathon et 8e journée professionnelle du groupe Systèmes & Données du programme Transition bibliographique (30 novembre et 1er décembre 2023, BnF)
Le moment est venu de se mettre au diapason des nouvelles données dans les systèmes de gestion de bibliothèque. Cela implique notamment une réflexion sur les interfaces de nos applications : en tant qu’utilisateur, comment interroger ces données ? comment les afficher ? quels services leur associer ? Le groupe Systèmes & Données vous propose de réfléchir à ces problématiques lors d’un datathon le 30 novembre.
Les résultats du datathon seront restitués publiquement lors de la journée professionnelle du 1er décembre. Celle-ci offrira aussi un refrain sur l’actualité du programme, et une présentation du projet Noemi mené par la BnF, première réalisation d’envergure pour la mise en musique de la Transition bibliographique.
Programme disponible en septembre.
En chiffres
3 300 notices Rameau et 850 000 notices bibliographiques modifiées en 2022 par traitements automatisés dans le cadre de la réforme de Rameau
En savoir plus sur la lettre d’information Actualités du catalogue