Covid-19 et confinement de mars 2020 dans les archives du web

Afin de mener à bien sa mission patrimoniale de dépôt légal de l’internet, la Bibliothèque nationale de France collecte régulièrement un échantillon du web français, à travers des collectes larges et des collectes ciblées. C’est dans ce cadre que les équipes chargées du dépôt légal numérique ont réalisé, dès la fin du mois de janvier 2020, des sélections de sites en lien avec l’épidémie de Covid-19. Si ces sélections se poursuivent encore aujourd’hui, une première collection, comportant des captures réalisées entre le 1er février et le 31 juillet 2020, a déjà pu être constituée.

 

Archives de l’internet - BnF

Une collecte collaborative

Cette collection d’archives rassemblant six mois de contenus web, de l’installation du virus sur le sol français jusqu’à la fin de l’état d’urgence sanitaire, en juillet 2020, tente de rendre compte du caractère global de cette crise sanitaire, sociale, mais également économique. Elle embrasse, en outre, la couverture médiatique de cet événement, les prises de position des acteurs institutionnels comme des différents citoyens, et plus largement les actions mises en œuvre pour endiguer la pandémie, la documenter, la comprendre et dont le web s’est fait l’écho.

Les sélections de sites, blogs, réseaux sociaux et vidéos, en lien avec l’épidémie de Covid-19, ont été menées par des conservateurs et bibliothécaires de la BnF et du réseau des correspondants régionaux travaillant dans quinze établissements partenaires en région. Elles couvrent l’ensemble du territoire national. Des captures à intervalle régulier ont été réalisées pour un même site et permettent de rendre compte de l’évolution des contenus web, et par extension de la situation sanitaire dans le temps. Entre juin et juillet 2020, des collectes Instagram et Vidéos ont par ailleurs été mises en œuvre. De la vidéo scientifique à la vidéo d’humour confiné, les chaînes vidéo collectées pendant cette période couvrent également les différents aspects de l’épidémie et du confinement de mars 2020.

Un travail de valorisation de cette collection d’archives auprès des chercheurs et d’un public plus large a été engagé par les bibliothécaires et  conservateurs de la BnF dès l’été 2020 et a donné lieu, le 17 mars 2021, à la publication d’un parcours guidé dans les Archives de l’internet, intitulé « L’épidémie de Covid-19 et le premier confinement ». À cette occasion, la page d’accueil de l’application «Archives de l’internet» fait peau neuve afin de mettre à l’honneur les contenus collectés au titre des archives web de la Covid-19.

Un parcours guidé pour explorer le web de l’épidémie

Parcours guidé Covid-19 - BnF


Les captures sélectionnées dans le cadre de ce parcours guidé permettent de retracer la chronologie de la propagation du virus – notamment à travers son traitement médiatique – mais aussi de témoigner de l’apparition de nouveaux mots qui ont servi à désigner cette situation inédite. 

Parmi ces nouveaux mots figure indéniablement le « confinement », mesure politique décrétée le 16 mars 2020 en France qui entraîne une restriction des libertés publiques ainsi qu’un arrêt brutal des déplacements de population et des échanges marchands. L’économie nationale connaît le début d’une crise majeure tandis que le système de santé, mis à mal également, s’efforce de contenir la flambée de nouveaux cas. Les attentes se tournent alors vers la recherche médicale qui étudie cette nouvelle forme de coronavirus et se lance dans la mise au point d’un vaccin. Les scientifiques investissent dans le même temps le débat public affichant parfois des avis divergents comme en témoigne la controverse autour de la chloroquine.

Dans l’impossibilité de se rencontrer ou de se réunir physiquement, les Français ont investi le web et les réseaux sociaux pour se cultiver, pour s’éduquer mais aussi pour s’exprimer. De nombreux exemples attestent de cette créativité développée pendant le confinement et dont les archives de l’internet permettent de garder une trace. Il en va de même pour les élans de solidarité tant vis-à-vis des professionnels en première ligne contre le virus qu’à destination des personnes les plus fragiles et vulnérables. Le déconfinement a vu fleurir des interprétations variées de l’événement et des propositions pour se réinventer. Un diaporama illustrant certaines des captures sélectionnées accompagne ce parcours guidé.
 

Découvrir le diaporama du parcours guidé

Découvrir le parcours guidé : L’épidémie de Covid-19 et le premier confinement

Nuage de mots Collecte Covid-19 -BnF - 2021 - BnF

Une archive pour la recherche 

La Bibliothèque nationale de France met en place les ressources et les outils techniques permettant l’exploitation de ce corpus unique par les chercheurs, historiens, documentaristes et journalistes. Les fichiers WARC qui conservent les données produites par les robots de la BnF durant la période déterminée, de janvier à juillet 2020, ont été intégralement indexés en plein texte. Cela inclut aussi bien les collectes courantes, la collecte de la presse en ligne et les sélections dynamiques effectuées en lien avec l’épidémie et ses conséquences. Le périmètre d’indexation a été défini en partenariat avec des chercheurs associés à la réflexion sur la valorisation de cette collecte. La Bibliothèque nationale de France a souhaité également expérimenter de nouveaux services autour de ces archives afin de faire évoluer son dispositif d’accueil des équipes de recherche. L’objectif est de promouvoir et faciliter l’exploitation et l’usage de ce matériau dans le cadre de partenariat avec le monde universitaire. Ces archives ont aussi vocation à être utilisées dans le cadre de projets internationaux du fait même du caractère global et transnational de la pandémie. Une première utilisation dans le cadre du projet WARCnet a permis d’avancer des comparaisons entre les webs nationaux et les archives produites par les différentes institutions européennes.

Une coopération internationale

IIPC-Collection-Covid-19 - IIPC-Collection-Covid-19


La BnF contribue au projet d’archivage international Novel Coronavirus (2019-nCoV) outbreak, lancé en février 2020 par le consortium International Internet Preservation Consortium (IIPC) en association avec Internet Archive. Cette collecte collaborative, complémentaire des collectes des contenus web nationaux en lien avec l’épidémie de COVID menées par de nombreuses institutions patrimoniales membres du consortium, a pour objectif  la constitution d’une collection transnationale, à la mesure du caractère global de la pandémie et représentatif de ses différentes dimensions. Les pages ou sites web sélectionnés pour archivage par les institutions parties prenantes du projet ont ainsi vocation à documenter les aspects scientifiques et médicaux, sociaux, économiques et politiques de l’épidémie, mais également les mesures locales d’endiguement ou les politiques vaccinales. Identifié très tôt, l’intérêt majeur d’une telle archive pour les travaux de recherche futurs, notamment pour une approche comparée ou transnationale de l’épidémie,  a présidé au lancement de l’initiative. Cette archive web est accessible en ligne, grâce à l’outil Archive-It depuis le site du consortium  IIPC, et constitue à ce titre un bel outil de valorisation du travail de sélection conduit par la BnF depuis un an. 

En savoir plus sur les coulisses de la collecte : 
Comment consulter les archives du web ?
Conformément au droit de la propriété intellectuelle, les collections de dépôt légal du web sont consultables dans les salles recherche des différents sites de la BnF ainsi que dans les bibliothèques de dépôt légal imprimeur en région.  – > En savoir plus sur les conditions d’ accès
 

Trois points d’entrée dans ces très riches collections sont proposés : 

  • la recherche par URL dans l’application “Archives de l’internet” permet de consulter les captures d’une page web à différentes dates. À partir de la page choisie comme point de départ, l’usager peut naviguer de lien en lien dans le web archivé comme sur le web vivant ;
  • Une partie des collections, parmi lesquelles les archives web de l’épidémie de Covid-19, ont fait l’objet d’une indexation plein texte, ce qui permet d’effectuer une recherche par mot, en texte libre, dans l’application “Archives de l’Internet Labs” ;
  • enfin, des parcours guidés proposent, à travers une sélection de commentée de sites emblématiques, une exploration thématique du web à différentes époques : «l’épidémie de Covid-19», «le web électoral de 2010 à 2015», «Mémoires de l’immigration maghrébine», etc. Consulter l’ensemble des parcours guidés  dans les Archives de l’internet 
Découvrez les articles consacrés à la collecte Covid-19 sur notre carnet de recherche :
Découvrez également la page consacrée aux zoonoses (mise à jour spécialement par le département des Sciences et techniques)