Aller au contenu
Accueil > Pages d'événement > Séminaire > Le web n’est pas mort : défis, méthodes et outils pour l’analyse des traces numériques

Le web n’est pas mort : défis, méthodes et outils pour l’analyse des traces numériques

Weblab

Séminaire

Date(s) : du 19 mars 2026 14 h 00 au 19 mars 2026 17 h 00

Lieu : Salle Seurat, médiathèque de la MMSH, Aix-en-Provence

Organisateur(s) / trice(s) à TELEMMe :

Atelier(s) organisateur(s) :

Partenaires :

  • Humathèque Condorcet
  • Médiathèque de la MMSH

PRÉSENTATION

Avec Valérie Schafer et Benjamin Ooghe-Tibanou

Sur inscription : https://evento.renater.fr/survey/inscription-seance-4-weblab-19-03-de-14h-a-17h-8erp25b2


PROGRAMME

  • The Web Is (not) Dead, Long Live the Internet … Archives
    Valérie Schafer

Le titre de cette présentation détourne celui de l’article très discuté, The Web Is Dead, Long Live the Internet (C. Anderson et M. Wolff, Wired, 2010). C’est un point de départ pour aborder les défis à la fois de l’archivage du Web et des usages scientifiques de ces archives sous l’angle de l’accès, des infrastructures, des pratiques, de la représentativité, du basculement d’un web ouvert vers des environnements fermés. En articulant retour d’expérience et perspectives, la présentation reviendra sur des enjeux et étapes ayant structuré l’archivage du web et ses usages scientifiques sur trois décennies avant d’ouvrir sur les défis actuels et futurs (plateformisation, fragmentation des environnements numériques, fermeture des API ou encore essor des contenus générés par IA). La transformation constante des formes de production et de circulation des contenus impacte la disponibilité et l’exploitabilité des traces numériques, comme les conditions de préservation, d’analyse, d’interopérabilité, de réutilisation des données.

Valérie Schafer est professeure en histoire contemporaine à l’université du Luxembourg et directrice adjointe du C2DH (Center for contemporary and digital history). Elle est également chercheuse associée au Centre Internet et Société (CIS-CNRS). Ses domaines d’expertise sont l’histoire de l’informatique et des cultures numériques et elle est co-éditrice de la revue Internet Histories. 

  • Hyphe
    Benjamin Ooghe-Tabanou

Développé au médialab de Sciences Po, Hyphe est un logiciel libre conçu pour offrir aux chercheurs et étudiants un crawler web orienté recherche afin de constituer et d’enrichir des corpus de sites web grâce à une méthodologie de terrain qualitative. Il fournit une méthode et un outil pour construire un corpus de recherche à partir de contenus web (pages web et liens HTTP) grâce à une approche innovante de curation progressive destinée à résoudre deux des principaux problèmes rencontrés en sciences sociales lors de l’exploration automatisée du web : construire un corpus thématique et délimiter la présence d’un acteur sur le web, à l’aide d’un processus itératif aidant les utilisateurs à sélectionner et définir de manière dynamique des « entités web » de manière à la fois granulaire et flexible, pour pouvoir choisir à la fois des pages individuelles, un sous-domaine, une combinaison de sites web, etc.

En partenariat avec les équipes officielles françaises d’archivage du web, Hyphe a récemment été enrichi afin de pouvoir également explorer les archives web d’archive.org ainsi que celles de la Bibliothèque nationale de France (BnF) et de l’Institut national de l’audiovisuel (INA), permettant ainsi aux utilisateurs de constituer des corpus web à partir du passé ou de compléter des corpus web provenant du web en direct avec des archives de sites web disparus.

Cette présentation sera suivie d’une démonstration avec mise en pratique.

Ingénieur généraliste, Benjamin Ooghe-Tabanou se spécialise dans l’informatique appliquée à la recherche scientifique. Après plusieurs expériences en astrophysique à Johns Hopkins et l’École Normale Supérieure, Benjamin investit les sciences humaines et sociales, d’abord en tant qu’activiste pour l’OpenData et la transparence parlementaire, puis au médialab de Sciences Po en tant qu’ingénieur de recherche en 2012, où il se concentre sur le webmining et le développement d’outils open source pour les sciences sociales. Il encadre l’équipe d’ingénieurs de recherche du médialab depuis 2020.