Les Archives du web électoral

Le 21 avril 2002, Jean-Marie Le Pen hisse pour la première fois l’extrême droite française au second tour d’un scrutin présidentiel avec 16,86 % des suffrages. Le candidat du Front national va affronter le président sortant Jacques Chirac, en tête des votes, Lionel Jospin terminant troisième. Les archives de l’Internet conservent des captures de sites de ce tournant de la vie politique française.

 

Page d’accueil des Archives de l’internet​​​​

Historique des collections

Depuis 2002, la BnF archive le web électoral français à l’occasion des principaux scrutins locaux et nationaux. Ces collections constituent un ensemble documentaire unique, témoin de la vie politique française. Il s’agit de contenus web éphémères par excellence qui disparaissent souvent peu de temps après le scrutin.

La collecte des sites des partis, des candidats, de différentes organisations engagées dans la campagne, de médias, d’observatoires de la vie politique, et d’un très large spectre d’acteurs de la société civile (associations, syndicats, chercheurs, militants, humoristes, simples citoyens intervenant sur les forums) et des sites de presse permet de rendre compte des différents débats et tendances qui traversent les campagnes électorales. Ces collections documentent aussi l’usage des nouveaux médias en ligne et les nouvelles problématiques qui émergent avec leur utilisation par les partis et les candidats : les forums et les blogs dans les années 2000 puis les réseaux sociaux avec Facebook et Twitter à partir de 2012, Instagram à partir de 2020 et Tik Tok à partir de 2022. 

13 collectes du web électoral ont été lancées par la Bibliothèque nationale de France depuis 2002, elles ont permis de couvrir 21 élections :

  • En 2002 : l’élection présidentielle et les élections législatives
  • En 2004 : les élections régionales et les élections européennes
  • En 2007 : l’élection présidentielle et les élections législatives
  • En 2009 : les élections européennes
  • En 2010 : les élections régionales
  • En 2012 : l’élection présidentielle et les élections législatives
  • En 2014 : les élections municipales et les élections européennes
  • En 2015 : les élections régionales
  • En 2017 : l’élection présidentielle et les élections législatives
  • En 2019 : les élections européennes
  • En 2020 : les élections municipales
  • En 2021 : les élections régionales et les élections départementales
  • En 2022 : l’élection présidentielle et les élections législatives

Les sélections sont réalisées par les bibliothécaires des départements Droit, Economie, Politique et Philosophie, Histoire, Sciences de l’homme de la BnF, avec la participation des bibliothèques de dépôt légal imprimeur pour les élections comportant une dimension locale (régionales, départementales, municipales, législatives) en 2004, 2007, 2010, 2012, 2015, 2017, 2020, 2021 et 2022. 

A partir de 50 000 URL sélectionnées, 41 Tio ou 66 Tio (non compressé) de données ont été collectés depuis 2002. 

Les collectes commencent en général avant les dates officielles de la campagne, afin d’inclure notamment les primaires, et se terminent quelques semaines après le deuxième tour afin de capturer les dernières réactions. Plusieurs fréquences de collecte sont utilisées : mensuelle, bi-mensuelle, hebdomadaire, pluri-quotidienne. 

Typologie des sites sélectionnés

Les sites doivent appartenir au domaine français couvert par la mission de dépôt légal de l’internet de la BnF, juridiquement défini par le code du patrimoine. Ce sont des sites soit en .fr, soit domiciliés en France, soit édités par un auteur résidant en France et pouvant utiliser une autre extension que le .fr. et ce, même dans le cas des élections européennes. 
La sélection doit tendre à respecter le pluralisme politique en couvrant la diversité des débats, et représenter toutes les grandes tendances se manifestant en ligne. On sélectionne des sites :
  • officiels et institutionnels comme les sites de l’Elysée, du Conseil constitutionnel, de la Commission nationale des comptes de campagne et des financements politiques ou des collectivités territoriales dans le cas d’élections locales. On y trouve aussi des sites relatifs au cadre légal et administratif : CNIL, vote par correspondance, e-administration, etc.
  • de partis politiques et de candidats (sites et blogs officiels ou personnels, permanents ou de campagne), de comités de soutien
  • analysant et commentant la campagne comme les sites d’instituts de sondages, de science politique, d’analystes politiques et des médias. Les sites de la presse nationale et locale, notamment les dossiers spéciaux « Elections » sont sélectionnés par la BnF. Les sites des radios et télévisions françaises sont archivés par l’INA.
  • d’expression de la société civile qui témoignent des principaux débats comme les forums, les plateformes participatives, les sites d’associations, de syndicats, de personnalités médiatiques, les contenus humoristiques ou satiriques qui circulent parfois de manière virale
Sont collectés aussi bien les grands sites nationaux que des comptes Twitter à l’échelle de la circonscription. Toutes les sélections prennent en compte l’ensemble du territoire français : villes, départements ruraux, départements et territoires d’outre-mer et les Français de l’étranger. Par exemple, lors de la campagne des municipales de 2020, ce sont 120 communes, réparties sur l’ensemble du territoire qui ont été retenues.
Les comptes sur les réseaux sociaux (qui peuvent varier au cours du temps : Facebook, Twitter, Instagram, Tik Tok…), et les chaînes de vidéos (Youtube principalement depuis 2017) font également partie du périmètre des collectes électorales.

    Retrouver la liste des sélections des collectes électorales

    Les parcours guidés

    Cliquer, voter : l’internet électoral - Parcours guidé dans les Archives de l’internet

     

    Ces parcours sont constitués de sélections thématiques d’archives réalisées par des bibliothécaires. Ils sont accessibles, comme le reste des collections du dépôt légal du web, dans l’application Archives de la l’internet à la BnF et dans les bibliothèques de dépôt légal imprimeur. 

    Trois d’entre eux sont consacrés au web électoral et présentent ainsi des manifestations en ligne des acteurs, observateurs et témoins des campagnes électorales : 

    Points d’attention et limites

    Compte tenu de l’ampleur du web électoral, tous les territoires et tous les candidats ne sont pas couverts à chaque élection. Par ailleurs, pour des raisons techniques, les collectes peuvent être incomplètes ou instables et certains contenus et médias comme les réseaux sociaux ou encore les vidéos et podcasts font l’objet de collectes spécifiques. 

    En savoir plus sur les modalités de constitution des collections 

    Modalités pratiques de consultation

    Les archives de l’internet sont consultables sur tous les postes informatiques des salles recherche de la BnF et dans les bibliothèques de dépôt légal imprimeur en région. La consultation se fait depuis le portail documentaire.

    En savoir plus sur la consultation des Archives de l’internet

    Travaux de recherche

    Les archives du web électoral conservées à la BnF sont mobilisées régulièrement par des travaux en sciences politiques, notamment des études de l’évolution du « faire campagne » ou du militantisme à l’heure d’internet. 

    Chercheurs associés en 2022 et 2023

    Deux chercheurs associés de la BnF travaillent sur les collections web électoral : 

    • Guillaume Levrier (chercheur associé en 2022, 2023) : Étude des représentations politiques du vivant sur l’internet français entre 1996 et 2016
    • Emilie Denis-Weyl (chercheure associée en 2022) : Cartographie des usages politiques de la laïcité (2002-2022)

    La cartographie du web appliquée aux archives du web électoral 

    En 2022, une collaboration avec le médialab Sciences Po et la bibliothèque de Sciences Po a permis l’adaptation de l’outil de curation et constitution de corpus Hyphe aux archives de l’Internet. Cet outil permet de faire de la cartographie du web et d’étudier, à partir de liens hypertextes entre les pages, les réseaux d’acteurs. Lors d’un Datasprint organisé au BnF DataLab en 2022, deux équipes ont ainsi travaillé sur les collections web électoral, pour étudier la transformation des communautés politiques de soutien aux candidats à l’élection présidentielle ou encore les représentations du vivant génomique dans les sites collectés lors de l’élection de 2002. Les résultats et la description de la méthodologie employée sont à consulter sur le site dédié.

     

    Visuels issus du Datasprint ResPaDon

     

       En savoir plus sur les travaux de recherche en lien avec les archives de l’internet

      Quelques exemples de collectes étrangères

      Contact