Centre d'aide
Récupération de données
Format et encodage des données
Le format UNIMARC utilisé par la BnF pour la diffusion de ses données reprend au maximum la traduction française par le Comité français UNIMARC (CfU) du format B et du format A du format international d’échange géré par le Comité permanent UNIMARC (PUC) de l’IFLA . Il est susceptible d’en différer légèrement pour exprimer les spécificités propres aux données de la BnF, qui sont produites en Intermarc. Les récupérateurs de données peuvent consulter la documentation de cet UNIMARC de diffusion afin de savoir en quoi il diffère de l’UNIMARC/IFLA, de l’UNIMARC/France ou de l’UNIMARC de production ou de diffusion de l’Abes.
Les caractères des notices importées peuvent mal s’afficher en raison d’un problème de compatibilité d’encodages. La BnF propose deux encodages des caractères pour la récupération de notices : ISO 5426 (jeu de caractères latins avec ou sans diacritiques) ou UNICODE UTF-8 (jeu de caractères pour tout système d’écriture). L’encodage des caractères dépend de son logiciel et peut être spécifié dans sa documentation ou précisé par son prestataire. Des jeux de tests sont mis à disposition pour aider à déterminer le format d’encodage adéquat.
En savoir plus sur les Jeux de tests pour l’encodage des caractères.
Identifier les données à récupérer
Une prénotice est composée de métadonnées sommaires (peu structurées, sans lien aux notices d’autorité) malgré quelques enrichissements (couvertures, résumés). Elles proviennent de versements des éditeurs lors de la déclaration de dépôt des ressources au titre du dépôt légal ou de notices temporaires créées pour l’acquisition de documents par la BnF.
Ces prénotices apparaissent dans BnF Catalogue général dès la réception des ouvrages et sont alors récupérables dans tous les services d’exposition de données (SRU, transfert de notices en ligne, Z3950). Le SRU offre un critère de recherche spécifique pour les cibler ou exclure de la recherche bib.status. Elles sont appelées à être reprises ultérieurement par les catalogueurs de la BnF.
Plusieurs centaines de milliers d’images de couvertures de documents (première et/ou quatrième de couverture) sont disponibles dans le Catalogue général, signalées dans les zones 950$a (zone Intermarc mentionnant une image de couverture). Ces images sont librement réutilisables.
Le Catalogue général permet de retrouver via les recherches simple et avancée une notice quelle que soit la forme de l’EAN ou de l’ISBN saisi (ISBN-10 ou 13).
La recherche avancée permet d’interroger jusqu’à 100 ISBN ou EAN simultanément. Dans les menus déroulants encadrant le champ de recherche par mots, choisir « Données éditoriales, ISBN, ISSN, etc. » et « Un des mots », puis saisir les ISBN (avec ou sans les tirets) séparés par un espace entre eux.
Les notices peuvent être exportées depuis la liste de résultats obtenue, au format tabulaire (CSV), sous forme de fichier à intégrer dans un SGB (ISO 2709) ou au moyen des autres exports existants (PDF, TXT ou envoi par courriel). L’API SRU offre la possibilité de rechercher par ISBN-10, 13 ou par EAN avec le critère bib.fuzzyISBN.
L’ensemble du corpus des documents audiovisuels dématérialisés est identifiable dans BnF catalogue générale en saisissant le terme « dlsondemat » dans l’encart de recherche simple. Ces notices peuvent être récupérées via le service de transfert de notices en ligne ou l’export CSV, ou être importées en masse par les services Z39.50 ou SRU en recherchant « dlsondemat » via le critère bib.anywhere
Il n’est pas possible d’exporter des instruments de recherche (IR) depuis BAM. Ils sont exportables via le CCFR en sélectionnant dans la recherche avancée « BnF-AM » :
https://ccfr.bnf.fr/portailccfr/jsp/public/index.jsp?action=public_formsearch_manuscrits
Utiliser les produits et services de récupération de données
Les deux services permettent de récupérer des données identiques.
Le transfert de notices en ligne propose de récupérer un fichier de notices au format ISO2709 par l’intermédiaire du Catalogue général, à charger dans son propre catalogue informatisé. Ce service est présenté de façon détaillée à la page Transfert de notices en ligne.
Le serveur Z39.50 permet d’interroger le Catalogue général et de récupérer les notices l’aide d’un client, directement intégré dans son SGB, ou externe comme Yaz. Il est possible d’automatiser la récupération.
Retrouver l’offre complète des services de récupération proposés par la BnF
Le fonctionnement est décrit dans le centre d’aide dédié à « Mes références ».
À noter : la date de transfert des notices n’est plus reportée dans « Mes références ». La date d’ajout des notices à l’espace « Mes références » demeure.
Des références bibliographiques peuvent être exportées dans Zotero depuis le Catalogue général de la BnF grâce à un « translator ». Pour plus d’information sur les « translators » Zotero, vous pouvez vous référer à cette page : https://www.zotero.org/support/dev/translators
Cet outil n’a pas été développé par la BnF, qui n’en assure pas non plus la maintenance. Sa dernière mise à jour remonte à 2017. Il est possible qu’il présente certaines imperfections, sur lesquelles nous ne sommes pas en mesure d’intervenir.
Une aide pour effectuer une extraction personnalisée de données (critères, format, encodage) peut être demandée en écrivant à coordination-bibliographique@bnf.fr. Selon la complexité de votre demande, un devis pourra vous être proposé.
Pour les chercheurs désirant un accompagnement personnalisé sur les données de la BnF, il est possible de contacter le DataLab .
Contacter la BNF
Vous pouvez nous contacter via le formulaire