Covid-19 et confinement de mars 2020 dans les archives du web
Une collecte collaborative
Cette collection d’archives rassemblant six mois de contenus web, de l’installation du virus sur le sol français jusqu’à la fin de l’état d’urgence sanitaire, en juillet 2020, tente de rendre compte du caractère global de cette crise sanitaire, sociale, mais également économique. Elle embrasse, en outre, la couverture médiatique de cet événement, les prises de position des acteurs institutionnels comme des différents citoyens, et plus largement les actions mises en œuvre pour endiguer la pandémie, la documenter, la comprendre et dont le web s’est fait l’écho.
Les sélections de sites, blogs, réseaux sociaux et vidéos, en lien avec l’épidémie de Covid-19, ont été menées par des conservateurs et bibliothécaires de la BnF et du réseau des correspondants régionaux travaillant dans quinze établissements partenaires en région. Elles couvrent l’ensemble du territoire national. Des captures à intervalle régulier ont été réalisées pour un même site et permettent de rendre compte de l’évolution des contenus web, et par extension de la situation sanitaire dans le temps. Entre juin et juillet 2020, des collectes Instagram et Vidéos ont par ailleurs été mises en œuvre. De la vidéo scientifique à la vidéo d’humour confiné, les chaînes vidéo collectées pendant cette période couvrent également les différents aspects de l’épidémie et du confinement de mars 2020.
Un travail de valorisation de cette collection d’archives auprès des chercheurs et d’un public plus large a été engagé par les bibliothécaires et conservateurs de la BnF dès l’été 2020 et a donné lieu, le 17 mars 2021, à la publication d’un parcours guidé dans les Archives de l’internet, intitulé « L’épidémie de Covid-19 et le premier confinement ». À cette occasion, la page d’accueil de l’application «Archives de l’internet» fait peau neuve afin de mettre à l’honneur les contenus collectés au titre des archives web de la Covid-19.
Un parcours guidé pour explorer le web de l’épidémie
Les captures sélectionnées dans le cadre de ce parcours guidé permettent de retracer la chronologie de la propagation du virus – notamment à travers son traitement médiatique – mais aussi de témoigner de l’apparition de nouveaux mots qui ont servi à désigner cette situation inédite.
Parmi ces nouveaux mots figure indéniablement le « confinement », mesure politique décrétée le 16 mars 2020 en France qui entraîne une restriction des libertés publiques ainsi qu’un arrêt brutal des déplacements de population et des échanges marchands. L’économie nationale connaît le début d’une crise majeure tandis que le système de santé, mis à mal également, s’efforce de contenir la flambée de nouveaux cas. Les attentes se tournent alors vers la recherche médicale qui étudie cette nouvelle forme de coronavirus et se lance dans la mise au point d’un vaccin. Les scientifiques investissent dans le même temps le débat public affichant parfois des avis divergents comme en témoigne la controverse autour de la chloroquine.
Dans l’impossibilité de se rencontrer ou de se réunir physiquement, les Français ont investi le web et les réseaux sociaux pour se cultiver, pour s’éduquer mais aussi pour s’exprimer. De nombreux exemples attestent de cette créativité développée pendant le confinement et dont les archives de l’internet permettent de garder une trace. Il en va de même pour les élans de solidarité tant vis-à-vis des professionnels en première ligne contre le virus qu’à destination des personnes les plus fragiles et vulnérables. Le déconfinement a vu fleurir des interprétations variées de l’événement et des propositions pour se réinventer. Un diaporama illustrant certaines des captures sélectionnées accompagne ce parcours guidé.
Découvrir le diaporama du parcours guidé
Découvrir le parcours guidé : L’épidémie de Covid-19 et le premier confinement
Une archive pour la recherche
La Bibliothèque nationale de France met en place les ressources et les outils techniques permettant l’exploitation de ce corpus unique par les chercheurs, historiens, documentaristes et journalistes. Les fichiers WARC qui conservent les données produites par les robots de la BnF durant la période déterminée, de janvier à juillet 2020, ont été intégralement indexés en plein texte. Cela inclut aussi bien les collectes courantes, la collecte de la presse en ligne et les sélections dynamiques effectuées en lien avec l’épidémie et ses conséquences. Le périmètre d’indexation a été défini en partenariat avec des chercheurs associés à la réflexion sur la valorisation de cette collecte. La Bibliothèque nationale de France a souhaité également expérimenter de nouveaux services autour de ces archives afin de faire évoluer son dispositif d’accueil des équipes de recherche. L’objectif est de promouvoir et faciliter l’exploitation et l’usage de ce matériau dans le cadre de partenariat avec le monde universitaire. Ces archives ont aussi vocation à être utilisées dans le cadre de projets internationaux du fait même du caractère global et transnational de la pandémie. Une première utilisation dans le cadre du projet WARCnet a permis d’avancer des comparaisons entre les webs nationaux et les archives produites par les différentes institutions européennes.
Une coopération internationale
La BnF contribue au projet d’archivage international Novel Coronavirus (2019-nCoV) outbreak, lancé en février 2020 par le consortium International Internet Preservation Consortium (IIPC) en association avec Internet Archive. Cette collecte collaborative, complémentaire des collectes des contenus web nationaux en lien avec l’épidémie de COVID menées par de nombreuses institutions patrimoniales membres du consortium, a pour objectif la constitution d’une collection transnationale, à la mesure du caractère global de la pandémie et représentatif de ses différentes dimensions. Les pages ou sites web sélectionnés pour archivage par les institutions parties prenantes du projet ont ainsi vocation à documenter les aspects scientifiques et médicaux, sociaux, économiques et politiques de l’épidémie, mais également les mesures locales d’endiguement ou les politiques vaccinales. Identifié très tôt, l’intérêt majeur d’une telle archive pour les travaux de recherche futurs, notamment pour une approche comparée ou transnationale de l’épidémie, a présidé au lancement de l’initiative. Cette archive web est accessible en ligne, grâce à l’outil Archive-It depuis le site du consortium IIPC, et constitue à ce titre un bel outil de valorisation du travail de sélection conduit par la BnF depuis un an.
- Friedel Geeraert et Nicola Bingham, «Exploring special web archives collections related to COVID-19 : The case of the IIPC Collaborative», WARCnet Paper, consultable en ligne
- The French coronavirus (COVID-19) web archive collection: focus on collaborative networks
Trois points d’entrée dans ces très riches collections sont proposés :
- la recherche par URL dans l’application “Archives de l’internet” permet de consulter les captures d’une page web à différentes dates. À partir de la page choisie comme point de départ, l’usager peut naviguer de lien en lien dans le web archivé comme sur le web vivant ;
- Une partie des collections, parmi lesquelles les archives web de l’épidémie de Covid-19, ont fait l’objet d’une indexation plein texte, ce qui permet d’effectuer une recherche par mot, en texte libre, dans l’application “Archives de l’Internet Labs” ;
- enfin, des parcours guidés proposent, à travers une sélection de commentée de sites emblématiques, une exploration thématique du web à différentes époques : «l’épidémie de Covid-19», «le web électoral de 2010 à 2015», «Mémoires de l’immigration maghrébine», etc. Consulter l’ensemble des parcours guidés dans les Archives de l’internet
- Les archives web du Coronavirus : une entreprise collective
- Dans les coulisses de la collecte COVID-19. Entretien sur les pratiques des correspondants du DLweb
- Voir également l’article : La BnF archive le web du coronavirus