Récupérer les données de la BnF (au format MARC)

La Bibliothèque nationale de France met à disposition les données de BnF catalogue général selon différentes modalités. Cette rubrique présente ces ensembles de données et propose des informations techniques sur les protocoles, outils et formats de récupération.

Contours de l’offre

Les notices mises à disposition sont celles de BnF catalogue général, le principal catalogue de la BnF, qui contient plus de 15 millions de notices bibliographiques et plus de 5 millions de notices d’autorité.

Pour en savoir plus sur le contenu du Catalogue général

Ces notices sont récupérables de plusieurs façons :

 

Quels formats ?

Les notices sont proposées aux formats :

  • INTERMARC (format de catalogage utilisé à la BnF) ;
  • UNIMARC (format d’échange international des bibliothèques) ;
  • Dublin Core (permet d’obtenir des descriptions plus sommaires, intéropérables à différents systèmes).

 

Modalités de récupération

Les jeux de données et/ou produits sont téléchargeables librement sur le site api.bnf.fr

Le transfert de notices en ligne est accessible directement depuis l’interface du Catalogue général, sans nécessité d’inscription. Les notices, exportables par lot de 5 000, sont récupérables sans délai et sans l’intermédiaire d’un serveur FTP.

La récupération par Z39.50 nécessite de disposer d’un client Z39.50. Il s’agit d’une brique souvent fournie dans les SGB (Système de Gestion de Bibliothèques).

Le service SRU,  adaptation du Z39.50 aux standards du web, peut être interrogé manuellement depuis un navigateur Internet ou être intégré dans du code informatique.

L’export CSV permet d’obtenir une sélection de notices (jusqu’à 30 000) directement depuis le Catalogue général. L’utilisateur a la possibilité de choisir les zones qu’il souhaite récupérer dans les notices. Le paramétrage professionnel propose de les extraire en UNIMARC ou en INTERMARC pour les notices bibliographiques et d’autorité. S’il choisit l’option de paramétrage public, il pourra extraire les zones souhaitées au format Dublin Core pour les notices bibliographiques. Ces données sont ensuite exportées dans un tableau exploitable dans un tableur.

 

L’offre de récupération de données en MARC 

  Jeux de données préconstitués Sélection de notices
  Produits Transfert de Notices en ligne Z39.50 SRU CSV
Format des données
UNIMARC
INTERMARC
UNIMARC
INTERMARC
UNIMARC
INTERMARC
UNIMARC INTERMARC DUBLIN CORE UNIMARC INTERMARC DUBLIN CORE
Format d’échange
ISO 2709 ISO 2709 ISO 2709 MarcXchange (XML) CSV
Encodage des caractères

ISO 5426
UTF8

ISO 5426
UTF8
ISO 5426
UTF8
ISO 8859
UTF8 UTF8
Modalités de récupération
Téléchargement des fichiers sur api.bnf.fr Depuis une liste de résultats dans BnF catalogue général À partir d’un client Z39.50, fourni par la plupart des SGB Interrogeable manuellement depuis un navigateur Internet ou intégrable dans du code informatique Depuis une liste de résultats dans BnF catalogue général
Contenu / Couverture (notices bibliographiques)
Notices bibliographiques de la production éditoriale française Toutes les notices bibliographiques Toutes les notices bibliographiques Toutes les notices bibliographiques Toutes les notices bibliographiques
Contenu / Couverture (notices d’autorité)
Notices d’autorité complètes Toutes les notices d’autorité Notices d’autorité complètes Toutes les notices d’autorité Toutes les notices d’autorité

Conditions d’utilisation

La BnF a, depuis le 1er janvier 2014, placé ses métadonnées descriptives (données bibliographiques et d’autorité) sous la « Licence Ouverte / Open Licence » de l’État élaborée par la mission Etalab. L’utilisation de ces métadonnées est libre et gratuite sous réserve du maintien de la mention de leur source et de l’indication de leur date de récupération.

Dans les notices récupérées, certains éléments doivent être conservés :

  • en format UNIMARC : le contenu des zones 801$b et 801$c.
  • en format INTERMARC : le numéro FRBNF présent en zone 001