L'intelligence artificielle à la BnF
Du numérique à l’IA, trente ans d’innovation à la BnF
Lancée en 1997, Gallica, la bibliothèque numérique de la BnF et de ses partenaires, regroupe aujourd’hui plus de 11 millions de documents numérisés. Cette politique de numérisation ambitieuse a été enrichie par des projets d’océrisation (reconnaissance optique de caractères) et de structuration des documents, créant ainsi un réservoir de données massif. Ce socle place aujourd’hui la BnF comme un acteur clé dans le domaine de l’intelligence artificielle francophone.
Dès 2009, avec l’automatisation de l’océrisation, la BnF a intégré des outils d’IA à ses processus et a participé à des projets de recherche nationaux et européens dans ce domaine. Elle a acté la portée stratégique de l’IA en se dotant dès 2021 d’une feuille de route dédiée, considérant l’IA comme un levier pour développer une gamme d’outils appliqués aux métiers de la bibliothèque, du catalogage à la conservation, en passant par la médiation culturelle et la gestion des collections. En 2021 également, la BnF a ouvert son Datalab à l’intention des chercheurs, afin de faciliter le déploiement d’usages scientifiques sur ses collections numériques, en particulier via des approches IA. A ce titre, l’IA est l’une des quatre grandes traversées du Contrat d’objectifs et de performance 2022-2026 de la BnF.
L’essor de l’IA générative à partir de 2022 a marqué une nouvelle étape décisive. Entre 2023 et 2024, la BnF a accéléré son engagement avec des projets d’envergure nationale et internationale, dans un contexte de renforcement de l’action publique sur l’IA, avec notamment l’adoption de l’AI Act européen en juillet 2024. Désormais, les données patrimoniales de la BnF offrent une opportunité unique pour contribuer à entraîner des modèles d’IA francophones souverains dans le strict respect du droit d’auteur. Grâce à ses savoir-faire et à ses collections d’exception, la BnF est, à l’ère de l’IA, plus que jamais un acteur clé de l’innovation culturelle en France et dans le monde.