Une feuille de route pour l'intelligence artificielle à la BnF
Chroniques : De quand date l’intérêt de la BnF pour les technologies d’intelligence artificielle ?
Emmanuelle Bermès : Pour répondre à cette question, il faut partir des collections : la BnF a commencé à constituer des collections numériques à partir des années 1990, d’abord avec la numérisation des documents, puis l’archivage du web et désormais le dépôt légal des documents dématérialisés. Cela représente aujourd’hui une masse dont la richesse, la profondeur et le rythme d’accroissement dépassent l’entendement humain.
Face à cela, il faut s’outiller, que ce soit pour traiter les collections ou pour les communiquer au public. Et ça n’est pas une nouveauté pour nous : dès le milieu des années 2000, on a utilisé les technologies de reconnaissance optique des caractères (OCR) pour pouvoir faire des recherches dans les textes numérisés. C’était déjà de l’IA, même si on n’utilisait pas ce terme. La BnF a assez tôt été identifiée par la communauté internationale des bibliothèques, archives et musées comme un interlocuteur important sur le sujet : en témoigne le fait que l’on a accueilli en décembre dernier la 3e conférence de ai4lam, dont la Bibliothèque est l’un des membres fondateurs.
Vous avez été chargée en 2019 de l’établissement d’une feuille de route autour de l’intelligence artificielle pour la BnF : dans quel but ?
La nécessité d’établir une feuille de route est née d’une double prise de conscience. D’une part, l’IA n’est pas un chantier en soi, mais une panoplie d’outils qui peuvent toucher tous nos secteurs d’activité, du catalogage à la médiation en passant par la conservation et le pilotage. Et d’autre part, nous sommes confrontés à une très grande diversité de maturité des applications de l’IA : si certains projets autour de la fouille d’images sont très avancés et susceptibles d’être prochainement proposés aux utilisateurs de Gallica, d’autres sont beaucoup plus expérimentaux, à l’image de DALGOCOL. Articuler ces chantiers en anticipant un avenir où les technologies d’IA vont gagner en maturité, c’est le rôle de notre feuille de route. Dans une institution comme la BnF, une grande diversité d’acteurs et d’outils sont mobilisés pour gérer la masse. La feuille de route garantit une cohérence des actions : elle s’attache à mutualiser les compétences et les briques technologiques, tout en ménageant une place pour l’expérimentation et la recherche – c’est d’ailleurs l’un des rôles du DataLab que nous avons lancé à l’automne dernier.
Face aux géants privés du numérique qui donnent le tempo en matière d’intelligence artificielle, quel peut être le rôle d’un acteur comme la BnF ?
L’enjeu pour une institution comme la BnF, c’est d’adopter des technologies qui ont vu le jour dans les secteurs de la recherche et de l’industrie, tout en étant attentive aux questions éthiques qu’elles soulèvent. Les technologies d’IA se nourrissent de données pour fonctionner. Les données personnelles des utilisateurs, les traces laissées sur le web par les usagers font partie des données exploitées par les industries pour cibler leurs offres et retenir l’attention. C’est ce qui leur permet de proposer des contenus censés répondre à vos goûts et attentes ; c’est aussi ce qui conduit à créer des effets de bulles de filtre, où l’on se voit sans cesse proposer des contenus de même type. Or une bibliothèque, c’est le contraire d’une bulle de filtre : élargir les horizons, vérifier les sources, établir la fiabilité des informations, tout cela constitue l’expertise des bibliothécaires. En tant que professionnels de l’information, nous sommes en bonne place pour comprendre et expliquer l’IA, mais aussi pour faire en sorte que ces technologies se développent au service des usagers, en proposant des approches vertueuses, sur le plan environnemental.
Propos recueillis par Mélanie Leroy-Terquem
Entretien paru dans Chroniques n° 93, janvier-mars 2021