Les skyblogs au service de la science

À l’été 2023, la BnF a procédé à l’archivage des blogs encore actifs sur la plateforme Skyblog, alors sur le point de fermer. Les dizaines de téraoctets de données ainsi sauvegardées sont venus enrichir les Archives de l’internet, mises à la disposition des chercheurs depuis 2008 et de plus en plus sollicitées par des équipes pluridisciplinaires.

 
© Claire Ardenti / BnF

 

L’annonce de la fermeture de la plateforme Skyblog au printemps dernier a suscité l’émoi de la génération qui, à l’orée des années 2000, a fait ses premiers pas sur le web à travers ce réseau. Bien avant l’émergence des réseaux sociaux, elle a offert la possibilité à plusieurs millions d’utilisateurs, pour la plupart adolescents, de bénéficier gratuitement d’un espace numérique personnalisé permettant de créer un blog et d’échanger avec d’autres membres. Prévenue en amont par les responsables de Skyblog, l’équipe du Dépôt légal numérique de la BnF a procédé en urgence à la collecte la plus complète et la plus fidèle possible des 12 607 289 blogs encore en ligne avant leur suppression.

Conserver les archives du web français

37 téraoctets et 1,8 milliards d’URL sauvegardés ont ainsi rejoint les serveurs sur lesquels la BnF conserve les archives du web français depuis près de trois décennies. Car le web, créé en 1993, a rapidement suscité l’intérêt de la Bibliothèque : elle acquiert à partir de 2004, auprès d’Internet Archive, les collections rétrospectives des premiers sites web français datant de 1996, tout en expérimentant elle-même le processus de collecte en 2002. À partir de 2006, la BnF est officiellement chargée de la mission de collecter, conserver, signaler et communiquer tous les contenus diffusés sur le web français, afin de constituer la mémoire numérique de demain. Des campagnes de collectes massives annuelles, ainsi que des collectes ciblées, plus complètes et plus fréquentes, enrichissent les collections. À ce jour, 48 milliards de pages web sont accessibles dans les Archives de l’internet pour un volume de 2 000 téraoctets de données. Ces sites archivés, qui pour la plupart n’existent plus ou vont disparaître du web vivant, constituent l’une des collections les plus anciennes et les plus riches au monde. À l’été 2023, la BnF a procédé à l’archivage des blogs encore actifs sur la plateforme Skyblog, alors sur le point de fermer. Les dizaines de téraoctets de données ainsi sauvegardées sont venus enrichir les Archives de l’internet, mises à la disposition des chercheurs depuis 2008 et de plus en plus sollicitées par des équipes pluridisciplinaires.

Des champs d’étude inédits

Le monde de la recherche s’est très tôt intéressé à ces nouvelles sources composées de documents nativement numériques qui ouvraient, à la croisée des sciences humaines et des sciences computationnelles, un champ d’étude inédit. Des historiens, des sociologues, des linguistes ou des spécialistes des sciences de l’information et de la communication ont commencé à s’en saisir. Dans un premier temps, des chercheurs désireux de constituer un corpus de données portant sur un sujet ou un événement particulier (mouvements sociaux, élections, Jeux olympiques) ont sollicité la Bibliothèque pour des actions de collecte ciblées. Des projets universitaires plus structurés ont ensuite vu le jour autour des archives web de la Grande Guerre, de la mémoire des migrations, des littératures francophones numériques, ou encore des nouvelles formes d’écriture numérique de l’histoire. Qu’ils concernent l’histoire du web ou l’analyse du temps présent à travers le web, près d’une vingtaine de projets de recherche, soutenus par la BnF, ont ainsi porté sur les collections du dépôt légal du web.

Un moment emblématique de l’histoire du web français

Avec les skyblogs, les chercheurs disposent désormais d’un corpus de sources qui représente un moment emblématique de l’histoire du web français. En ouvrant un espace d’expression populaire sans précédent, composé de journaux personnels, de blogs officiels, de galeries d’images, de photos et de vidéos, la plateforme a en effet permis à toute une génération de créer de nouvelles formes de sociabilité. On peut aujourd’hui y voir une cartographie du déploiement de la culture numérique dans la société française, à la frontière entre conversation et publication, à un moment où la conscience des enjeux d’identité et de réputation numérique n’est pas encore forgée. De nombreux chercheurs ont tout de suite identifié la valeur de cette collection, à l’instar d’Emmanuelle Bermès, responsable pédagogique du master Technologies numériques appliquées à l’histoire de l’École nationale des chartes, qui y voit l’occasion de « poser les fondements épistémologiques d’une discipline de la source web, encore en construction ». Pour elle, « le rapport émotionnel à ces objets dépourvus de matérialité implique un autre rapport au passage du temps, un régime d’historicité en pleine mutation, passionnant à observer pour l’historien du temps présent ». Les skyblogs sont morts, vivent les skyblogs.

Vladimir Tybin

Article paru dans Chroniques n° 99, janvier-mars 2024