L'Intelligence artificielle, un axe stratégique
La feuille de route IA de la BnF
En 2021, la BnF s’est dotée d’une feuille de route dédiée à l’IA, offrant une vision stratégique à cinq ans. Cette démarche anticipait l’évolution rapide des technologies d’IA et leur montée en puissance. Pensée pour garantir la cohérence des actions menées au sein de l’établissement, la feuille de route positionne l’IA comme un levier transversal.
Cinq domaines d’application stratégiques ont été identifiés, en lien direct avec les grandes missions de la BnF :
- L’aide au catalogage et au signalement des collections ;
- L’exploration des collections et l’amélioration de l’accès ;
- La médiation, la valorisation et l’éditorialisation des collections ;
- La gestion des collections, des entrées à la conservation ;
- L’aide à la décision et au pilotage.
Pour concrétiser cette vision, la feuille de route s’articule autour de cinq actions clés :
- Inscrire l’IA dans la stratégie de l’établissement ;
- Organiser la recherche et développement (R&D) ;
- Acquérir de nouvelles compétences, essentielles à la réussite des projets IA ;
- Préparer les infrastructures et les données ;
- Mettre en place un programme pluriannuel en partenariat avec des acteurs clés.
À l’approche de l’échéance de cette feuille de route, une grande partie de ces objectifs a déjà été atteinte. L’IA est désormais inscrite dans le Contrat d’objectifs et de performance (COP), et une cellule IA a été créée : un groupe d’experts transversal dédié à la coordination stratégique et opérationnelle des projets d’IA de la BnF. Cette cellule IA joue un rôle clé dans l’acculturation des professionnels de la BnF aux enjeux et opportunités de l’IA. Elle propose ainsi un large éventail de formations, d’ateliers et de ressources internes.
Par ailleurs, la BnF mène de nombreux projets de recherche & développement, des expérimentations, ainsi qu’un projet en phase d’industrialisation ou encore au sein de consortiums lauréats d’appels à projets d’envergure. Vous retrouverez des exemples de projets dans la rubrique « Projets ».
Lire la feuille de route (synthèse visuelle)
Le tournant de l’IA générative : la valeur des « collections comme données »
Depuis 2022, avec la démocratisation de l’IA générative et la course mondiale aux données d’entraînement, le rôle stratégique des collections numériques de la BnF s’est considérablement renforcé. Son réservoir est unique par sa profondeur historique et la diversité de ses contenus culturels. Il contient :
- 480 milliards de mots issus des collections numériques ;
- 2 pétaoctets de données audiovisuelles et multimédia ;
- 2 pétaoctets de données du dépôt légal du web.
Ces données sont enrichies par plus de 18 millions de notices bibliographiques certifiées. Pour garantir la conservation durable de ces ressources, la BnF s’appuie depuis 2010 sur le système SPAR, une infrastructure développée en interne. Ce système, reconnu comme une référence nationale, assure l’indépendance technologique de la BnF et permet l’archivage pérenne de documents patrimoniaux dans tous les formats.
Bien avant l’avènement de l’IA générative, la BnF avait déjà fait de la donnée un pilier stratégique. Depuis plus de dix ans, elle explore la notion de « collections comme données » et propose des services dédiés. Des API permettent d’exploiter les contenus numériques libres de droits diffusés par la BnF, accessibles sur le site api.bnf.fr, à condition de respecter les Conditions générales d’utilisation de Gallica et les dispositions du Code des relations entre l’administration et les entreprises (CRPA) pour les usages commerciaux.
En 2021, la BnF a franchi une nouvelle étape avec la création du BnF DataLab. Ce laboratoire, à la fois physique et numérique, facilite l’accès aux données pour les publics académiques. En à peine quatre ans, il est devenu un point de référence pour les demandes d’expertise et de mise à disposition de jeux de données. Le DataLab a permis de développer des méthodologies et outils dédiés, soutenant des projets de recherche, notamment dans le domaine de l’intelligence artificielle.
Voir aussi BnF DataLab, IA et collections numériques
À partir de 2023, la BnF a renforcé sa collaboration avec les pouvoirs publics et l’écosystème IA pour organiser la mise à disposition de données patrimoniales libres de droits dans le cadre de partenariats encadrés. Dès 2025, la BnF ambitionne de proposer une solution d’intérêt général dédiée à la fourniture de jeux de données massifs et spécifiques libres de droits, au service de l’écosystème IA. En parallèle, la BnF contribue à la réflexion menée par le Conseil supérieur de la propriété littéraire et artistique (CSPLA), à la demande de la ministre de la Culture sur l’élaboration d’un modèle de rémunération pour les auteurs et éditeurs dont les données sous droits seraient utilisées légalement par les entreprises de l’IA. Fidèle à son rôle de tiers de confiance, la BnF entend continuer à concilier protection des droits des créateurs et soutien à l’innovation.
Ces enjeux dépassent les frontières nationales et mobilisent l’ensemble des institutions patrimoniales à l’échelle mondiale. Dans ce cadre, la BnF coopère activement avec des partenaires internationaux, en particulier francophones, afin de promouvoir l’interopérabilité des jeux de données et de renforcer le rôle de la francophonie dans le développement de l’IA.
Grâce à son expertise et à ses collections exceptionnelles, la BnF est en mesure de contribuer au développement d’une IA francophone dans un cadre responsable et éthique.