Peu après l’apparition du coronavirus en Chine et les débuts de sa propagation en Europe, le service du
Dépôt légal numérique de la BnF, qui a pour mission le dépôt légal du web (voir encadré), a mis en place une collecte dédiée. Commencée début janvier 2020, avec le suivi de hashtags comme
#JeNeSuisPasUnVirus ou
#CoronavirusEnFrance qui faisaient alors leur apparition sur Twitter, la collecte Covid-19 suit l’évolution et l’impact global de la pandémie sur le web français. Elle s’attache à embrasser toutes les facettes de la crise sanitaire, via ses aspects médicaux et scientifiques, mais aussi sociaux, économiques et politiques, ou encore culturels et moraux.
Une sélection documentaire dynamique et réactive
Pour cela, l’équipe du dépôt légal numérique sélectionne des contenus en veillant à ce que les sites web, blogs et médias sociaux archivés forment un ensemble cohérent, significatif et représentatif. Elle détermine également la fréquence des collectes effectuées par le biais de robots - plusieurs fois par jour pour les réseaux sociaux, une fois par jour pour les sites de presse nationale et régionale, etc. Cette démarche n’a rien d’inédit pour la BnF, qui organise régulièrement des collectes dites d’« actualités éphémères » afin e saisir les répercussions d’un événement sur le web et les réseaux sociaux, comme ce fut le cas lors du mouvement des « gilets jaunes » ou de l’incendie de Notre-Dame. À la mi-avril, la collecte Covid-19 couvrait ainsi près de 2 000 sources, et comprenait de nombreuses pages qui ont d’ores et déjà disparu du web vivant.
Une collecte qui s’appuie sur un réseau de correspondants étendu
Une telle réactivité est rendue possible à la fois par l’expertise de la BnF en matière de collecte du web, qu’elle pratique depuis 1999, et par l’appui de nombreux correspondants, à la fois en interne et sur tout le territoire français. Depuis 2015, un réseau a ainsi été déployé dans les 26 bibliothèques territoriales et services d’archives qui partagent la mission de dépôt légal du web et qui participent aux collectes collaboratives comme celles qui touchent l’activité électorale française.
Ce travail d’ampleur a par ailleurs permis à la BnF d’apporter sa contribution au projet d’archivage international
Novel Coronavirus (2019-nCoV) outbreak, lancé en février 2020 par le consortium International Internet Preservation Consortium (IIPC) en association avec Internet Archive.
Ainsi s’amassent, sur les serveurs de la BnF, les fonds qu’exploreront les chercheurs du futur, et qui pour l’heure constituent une mémoire collective de la crise sanitaire. C’est là tout l’enjeu du dépôt légal du web, qui conjugue valeur documentaire et valeur mémorielle.
Qu’est-ce que le dépôt légal du web ?
Le dépôt légal du web a été instauré par la loi Dadvsi de 2006 dans la lignée de ses illustres prédécesseurs. Mais si les livres, journaux et autres documents imprimés, multimédias ou audiovisuels font l’objet d’un dépôt obligatoire, le web peut difficilement être appréhendé la même manière. De fait, contrairement aux autres dépôts légaux, celui du web ne se fixe pas pour objectif l’exhaustivité mais la représentativité. Autre différence : si le dépôt légal du livre, comme son nom l’indique, impose aux éditeurs de déposer leurs productions, celui du web est opéré directement par la Bibliothèque, sans que ni les producteurs ni les hébergeurs de contenus n’aient de démarche à effectuer.
Pour en savoir plus http://chroniques.bnf.fr/pdf/chroniques_86.pdf