La BnF archive le web du coronavirus

La Bibliothèque nationale de France collecte le web français et offre à ses lecteurs la possibilité de consulter des archives remontant à 1996. En prise directe avec l’actualité, les équipes chargées du dépôt légal numérique rassemblent minutieusement la matière sur laquelle travailleront les futurs chercheurs. Elles procèdent, depuis le mois de janvier, à la collecte de contenus liés au Covid-19.
Dans le « cluster » de l’Oise, l’abstention bat des records à cause du coronavirus. francetvinfo.fr. Capture du 16 mars 2020.
Peu après l’apparition du coronavirus en Chine et les débuts de sa propagation en Europe, le service du Dépôt légal numérique de la BnF, qui a pour mission le dépôt légal du web (voir encadré), a mis en place une collecte dédiée. Commencée début janvier 2020, avec le suivi de hashtags comme #JeNeSuisPasUnVirus ou #CoronavirusEnFrance qui faisaient alors leur apparition sur Twitter, la collecte Covid-19 suit l’évolution et l’impact global de la pandémie sur le web français. Elle s’attache à embrasser toutes les facettes de la crise sanitaire, via ses aspects médicaux et scientifiques, mais aussi sociaux, économiques et politiques, ou encore culturels et moraux.
 

Une sélection documentaire dynamique et réactive

Pour cela, l’équipe du dépôt légal numérique sélectionne des contenus en veillant à ce que les sites web, blogs et médias sociaux archivés forment un ensemble cohérent, significatif et représentatif. Elle détermine également la fréquence des collectes effectuées par le biais de robots - plusieurs fois par jour pour les réseaux sociaux, une fois par jour pour les sites de presse nationale et régionale, etc. Cette démarche n’a rien d’inédit pour la BnF, qui organise régulièrement des collectes dites d’« actualités éphémères » afin e saisir les répercussions d’un événement sur le web et les réseaux sociaux, comme ce fut le cas lors du mouvement des « gilets jaunes » ou de l’incendie de Notre-Dame. À la mi-avril, la collecte Covid-19 couvrait ainsi près de 2 000 sources, et comprenait de nombreuses pages qui ont d’ores et déjà disparu du web vivant.
 

Une collecte qui s’appuie sur un réseau de correspondants étendu

Une telle réactivité est rendue possible à la fois par l’expertise de la BnF en matière de collecte du web, qu’elle pratique depuis 1999, et par l’appui de nombreux correspondants, à la fois en interne et sur tout le territoire français. Depuis 2015, un réseau a ainsi été déployé dans les 26 bibliothèques territoriales et services d’archives qui partagent la mission de dépôt légal du web et qui participent aux collectes collaboratives comme celles qui touchent l’activité électorale française. 
Ce travail d’ampleur a par ailleurs permis à la BnF d’apporter sa contribution au projet d’archivage international Novel Coronavirus (2019-nCoV) outbreak, lancé en février 2020 par le consortium International Internet Preservation Consortium (IIPC) en association avec Internet Archive.
Ainsi s’amassent, sur les serveurs de la BnF, les fonds qu’exploreront les chercheurs du futur, et qui pour l’heure constituent une mémoire collective de la crise sanitaire. C’est là tout l’enjeu du dépôt légal du web, qui conjugue valeur documentaire et valeur mémorielle.

Pour en savoir plus sur cette collecte et découvrir des exemples de sites collectés dans ce cadre, consultez le billet dédié sur le carnet de recherche Webcorpora

 

 
Qu’est-ce que le dépôt légal du web ?
Le dépôt légal du web a été instauré par la loi Dadvsi de 2006 dans la lignée de ses illustres prédécesseurs. Mais si les livres, journaux et autres documents imprimés, multimédias ou audiovisuels font l’objet d’un dépôt obligatoire, le web peut difficilement être appréhendé la même manière. De fait, contrairement aux autres dépôts légaux, celui du web ne se fixe pas pour objectif l’exhaustivité mais la représentativité. Autre différence : si le dépôt légal du livre, comme son nom l’indique, impose aux éditeurs de déposer leurs productions, celui du web est opéré directement par la Bibliothèque, sans que ni les producteurs ni les hébergeurs de contenus n’aient de démarche à effectuer.
Pour en savoir plus http://chroniques.bnf.fr/pdf/chroniques_86.pdf