Mener des recherches sur les archives du web

Vous souhaitez retrouver une page disparue du web vivant ? Utiliser les archives du web français conservées à la BnF dans vos recherches ? Faire de la fouille de données sur les collections existantes ? Stabiliser et pérenniser un corpus de sites web sur lequel vous travaillez ?
Découvrez les services et outils proposés par la BnF pour vous accompagner dans votre usage des archives du web.
 
Colloque 20 ans d’archives de l’internet en France (archivage du web) - © Emmanuel Nguyen Ngoc / BnF

 

Les archives du web : une source utile pour vos recherches

Comment les pratiques de médiation numérique des musées français ont-elles évolué au cours des 20 dernières années ? Comment les réseaux d’écrivains se sont-ils reconfigurés avec le numérique ? Comment le web et les réseaux sociaux ont-ils bousculé les façons de militer, transformé en profondeur l’écriture de soi ? Comment retrouver les premiers sites d’art numérique ? Comment le design des blogs d’amateurs de science-fiction a-t-il évolué ? Comment se préparaient les athlètes des jeux olympiques il y a dix ans ? Toutes ces questions impliquent de pouvoir explorer le web du passé et des traces de différentes époques, ce que permettent les archives du web.

Les archives du web sont accessibles sur l’ensemble des postes des salles recherche de la BnF et dans un réseau de bibliothèques partenaires.

En savoir plus sur les modalités d’accès et de réutilisation de ces collections

Découvrir le carnet de recherche du dépôt légal du web

L’accompagnement des projets de recherche sur les archives du web

Plusieurs services d’accompagnement sont proposés allant de l’aide ponctuelle à la mise en place d’un véritable partenariat.

Accompagnement ponctuel et aide à la recherche documentaire

Le guide des Archives de l’internet vous donne toutes les premières informations indispensables pour bien aborder cette source. Il vous donne un premier aperçu des modes de recherche possible : la recherche par adresse URL sur l’ensemble des collections (application Archives de l’internet), la recherche plein texte sur quelques collections choisies (Archives de l’internet Labs) et les parcours guidés thématiques produits par les archivistes ou des chercheurs partenaires.

Vous recherchez une présentation des archives du web pour préparer votre projet ? Vous avez la possibilité de vous inscrire au BnF DataLab. Vous pourrez bénéficier de sessions adaptées de présentation des collections et de prise en main des outils de recherche. Des rendez-vous avec des experts peuvent vous être proposés pour une aide documentaire ponctuelle ou des présentations plus avancées du service.

En savoir plus sur l’inscription au BnF DataLab

Venir travailler avec vos étudiants

Des accueils de groupes d’étudiants, de la licence au master 2, sont régulièrement proposés. Plusieurs formats sont possibles : présentation du dépôt légal du web et des collections, sessions d’exercices pour prendre en main les outils de consultation, ateliers d’exploration collective des archives du web sur une thématique donnée. 

Des dispositifs d’accueil pour tout type de projet de recherche

Les dispositifs d’accueil proposés par la BnF vous permettent de bénéficier d’un accompagnement adapté à votre profil et à vos projets. Deux dispositifs, chercheurs associés et résidence BnF DataLab, donnent lieu chaque année à un appel à candidature.

Retrouver les appels en cours sur le carnet de recherche de la BnF

Chercheurs associés

La BnF publie chaque année depuis 2003 un appel aux jeunes chercheurs désireux de travailler sur les collections conservées, qu’elles soient matérielles ou numériques. Le statut de chercheur associé vous permet de bénéficier d’un accompagnement méthodologique et scientifique, d’un accès privilégié aux données collectées au titre du dépôt légal du web. Ce dispositif d’un an est renouvelable deux fois.

En savoir plus sur le dispositif chercheur associé

Appel à projet BnF DataLab

Cet appel à projet est proposé en partenariat avec l’Infrastructure de Recherche Huma-Num. Il porte exclusivement sur les collections numériques de la BnF. Les projets lauréats bénéficient de l’offre de service du BnF DataLab et d’un financement. L’objectif de l’appel est de favoriser le développement et le partage de méthodologies et d’outils facilitant les opérations de fouille, de constitution de corpus et d’analyse computationnelle. 
En savoir plus sur les services du BnF DataLab

Projet conventionné

Des partenariats de recherche sont possibles entre la BnF et un ou plusieurs laboratoires de recherche. Les objectifs du projet sont établis par convention. Dans le cadre de projet soutenu financièrement par l’ANR, un labex ou d’ERC, la BnF peut être impliquée dans l’une des phases du projet. Pour les archives du web, elle apporte une expertise méthodologique et d’ingénierie sur les projets de collecte, de fouille de données ou de valorisation pédagogique.

L’offre de service du BnF DataLab sur les archives du web

Le BnF DataLab a été conçu comme un espace physique et virtuel d’accompagnement. Il repose sur une offre de service commune articulant formation, ingénierie de projet, valorisation des résultats de recherche et des services plus spécifiques à une ressource.

Trois services ont été plus spécifiquement pensés pour accompagner les projets portant sur les archives du web.

Collecte à la demande 

Pour concevoir et archiver un corpus web en relation avec votre sujet d’étude. Les corpus doivent respecter le périmètre juridique du dépôt légal du web (web français, hors site de radios et télévision relevant du périmètre de l’Institut national de l’audiovisuel).

Aide à la fouille de texte et de données

Pour constituer un corpus, réaliser une cartographie ou produire des datavisualisation à partir des archives du web. La BnF met à votre disposition des outils partagés par la communauté scientifique (en exemple Hyphe développé par le médialab Sciences Po) ou développés par celle des archivistes (SolrWayback de la bibliothèque royale du Danemark), qui viennent compléter les applications de consultation.

Le BnF DataLab propose des sessions de démonstration et prise en main de ces outils selon votre besoin.

Extraction de données et métadonnées

À des fins d’analyse, il vous est possible de demander l’extraction de contenus web archivés ou de jeux de métadonnées. Les archivistes peuvent vous présenter les formats disponibles, ainsi que leurs caractéristiques techniques, et vous fournir de premiers jeux test ou échantillons. L’extraction est conçue en fonction de votre besoin et accompagnée par les experts BnF.

Une ouverture à l’international

La BnF est membre du Consortium international pour la préservation de l’internet (IIPC), qui rassemble les organisations de 35 pays dans un souci de coopération et partage des bonnes pratiques.

L’IIPC soutient le développement d’outils et de standards communs, met en place des collectes transnationales sur des grands sujets d’actualité et favorise l’usage et les pratiques d’apprentissage et de recherche sur les archives du web. Plusieurs groupes de travail réunissent des experts de différents pays sur des problématiques en lien avec la formation, la recherche, le développement des collections.

La BnF est pleinement engagée auprès de ses partenaires, institutions et utilisateurs, et présente régulièrement l’avancée de ses travaux lors des principales manifestations internationales : Web Archiving Conference (WAC) organisée par l’IIPC et la conférence du Research Infrastructure for the Study of Archived Web Materials (RESAW).

En 2024, la BnF hébergera la WAC. Retrouvez-nous, ainsi que nos partenaires d’IIPC, les 25 et 26 avril 2024.

En savoir plus sur la coopération internationale autour de l’archivage du web

Ressources

Guide des Archives de l'internet

FR - PDF - 402.78 Ko

Contact