Dime Web

L’instrument Dime Web était une équipe de un à trois ingénieurs, pilotée au médialab de Sciences Po, accompagnant des projets de recherche en Sciences Humaines et Sociales dans la conception, le développement et l’emploi de méthodes numériques afin d’exploiter le web comme terrain d’enquêtes. L’instrument a ainsi développé de nombreux outils afin d’aider différents projets de recherche à collecter, enrichir, nettoyer, visualiser et analyser des données à partir des traces numériques accessibles sur Internet.

Frise chronologique Dime Web

Objectifs

Dime Web visait à équiper le monde des Sciences Humaines et Sociales pour exploiter les traces numériques laissées sur le web. L’instrument s’adressait à différents publics avec différents types d’approches et temporalités : conseil dans le choix et l’usage de méthodes numériques, identification de sources disponibles sur la toile, développement intégral d’outils génériques libres et open source largement réutilisables, formations pédagogiques ou académiques, appui méthodologique, soutien ponctuel l’espace d’un atelier d’une après-midi, accompagnement tout au long d’un projet de recherche sur plusieurs années, etc.

À ces fins, l’instrument a développé et mis à disposition de tous une palette d’outils sous la forme de logiciels permettant de collecter des données sur l’ensemble du web ou sur des plateformes cibles comme par exemple Twitter (avec le logiciel Gazouilloire), de les nettoyer, les enrichir et les catégoriser, ou encore de les visualiser, les explorer et les étudier, notamment sous l’angle de l’analyse de réseaux. Libres et open source, ces outils sont non seulement librement téléchargeables, installables et retouchables par des tiers, mais également pour une grande partie d’entre eux directement fonctionnels en ligne, à l’instar par exemple des utilitaires Table2Net, ScienceScape, CatWalk, ou encore SeeAlsology.

Le plus ambitieux des outils développés dans ce contexte a été le crawler Hyphe, qui permet de constituer simplement et qualitativement des corpus web de liens hypertextes entre acteurs agrégés quantitativement sur la toile. En combinant à la fois une haute technicité et une large utilisabilité, Hyphe offre aux étudiants et chercheurs en SHS une méthode exploratoire et quali-quantitative pour étudier les communautés d’intérêts autour de leurs sujets de recherche. Il est employé aujourd’hui par des chercheurs de plusieurs pays en Europe et outre Atlantique et alimente régulièrement de nouvelles publications académiques à travers le monde.

Positionnement

L’équipe de Dime Web se positionnait à l’intersection des domaines de la recherche méthodologique et des méthodes numériques en SHS. En plus d’accompagner les chercheurs dans leur méthodologie, elle leur apportait ses compétences dans l’analyse de réseaux, l’archivage du web, ainsi que l’analyse des controverses suivant la théorie Acteur Réseau de Bruno Latour. Les membres de l’équipe opérationnelle ont signé ou cosigné une quinzaine de publications académiques, dont un article sur PlosOne en 2015 sur l’algorithme ForceAtlas2 de spatialisation de réseaux mis en œuvre dans le logiciel Gephi, ainsi que divers articles présentant Hyphe, notamment aux conférences ICWSM 2016, FOSDEM 2018 et Web Studies 2018.

Le lien avec l’environnement local de recherche et d’innovation reposait essentiellement sur l’échange technologique. Les technologies libres et open source utilisées et/ou développées par Dime Web s’inscrivaient dans le cadre plus large des travaux du médialab et de son écosystème d’acteurs spécialistes des questions de réseau et de visualisation de données. Des acteurs du secteur privé se sont également montrés ponctuellement intéressés par des formations à ces technologies.

Les domaines historiquement les plus réceptifs à ces travaux ont été les web studies, l’analyse de réseaux sociaux et la cartographie des controverses. L’instrument a trouvé une vaste gamme d’utilisateurs académiques et universitaires en France mais aussi à l’étranger, et notamment dans plusieurs pays d’Europe où le médialab a tissé des liens au sein de la communauté des méthodes numériques : la Digital Methods Initiative de Richard Rogers) à Amsterdam, le Tantlab à Copenhague, le King’s College à Londres, etc. Ainsi depuis 2011, de nombreuses formations et communications, notamment sur Hyphe, ont été données dans différents pays d’Europe et au-delà, et les outils de Dime Web ont pu être déployés en interne dans diverses universités en Angleterre, au Danemark ou aux États-Unis.

Fonctionnement

L’équipe opérationnelle de Dime Web s’est reposée essentiellement sur le recrutement de deux ingénieurs en 2011 et 2012, qui mutualisaient leur temps de travail avec le médialab de Sciences Po, ce qui permettait notamment d’accéder à des compétences plus variées issues de ce laboratoire (designers, développeurs experts en Javascript, chercheurs, etc.).

L’accompagnement de projets de recherche recouvre des réalités différentes qui étaient prises en compte par plusieurs niveaux d’implication de l’instrument. Les demandes d’aide ponctuelle, qui étaient souvent aussi des demandes d’orientation, se faisaient gratuitement pendant l’atelier portes-ouvertes mensuel de méthodes de Sciences Po initié au médialab. C’est souvent là également que s’effectuait un premier contact qui pouvait ensuite être développé jusqu’à une prestation payante. Dime Web donnait également des formations à des groupes de chercheurs et doctorants, soit dans le cadre de l’accompagnement d’un projet, soit indépendamment par exemple lors d’écoles d’été. À partir de 2014, l’accès à l’équipement pour de l’accompagnement, de la formation ou de la co-construction de recherches s’est fait uniquement de façon payante pour les membres internes comme externes du consortium de l’Equipex, et a ainsi participé au financement du travail de développement des outils génériques.

Un Comité Scientifique et Technique (CST) spécifique à Dime Web assurait le suivi de la sélection des projets et l’orientation de l’instrument sur la base d’une réunion physique annuelle et d’échanges numériques. Entre 2014 et 2020, la sélection et le soutien des petits projets nécessitant une plus forte réactivité sans requérir de coûteux développements (au contraire des plus gros projets) ont été délégués à l’équipe opérationnelle et le CST a endossé un rôle de supervision annuelle.

Schéma de fonctionnement Dime Web

Membres du CST Dime Web:

  • Dominique Cardon,
  • Dana Diminescu,
  • Guilhem Fouetillou,
  • Dominique Goux,
  • Delphine Lagarde,
  • Raphaël Laurent,
  • Olivier Martin,
  • Clément Oury,
  • Franck Rebillard,
  • Roxane Silberman,
  • Jérôme Thièvre
  • Tommaso Venturini.

Apports

Dime Web a accompagné tout au long de la vie de l’instrument plus de vingt projets de recherche portés par des équipes issues d’horizons les plus divers, de la sociologie à l’économie en passant par les sciences politiques. Ainsi par exemple des projets RiscoVac et PerseVac que l’instrument Web a aidé à étudier les controverses autour de la vaccination sous l’angle du Web, en mesurant et évaluant la présence et l’influence des acteurs anti-vaccins sur le web et les réseaux sociaux. De même par exemple avec les économistes du projet SoWell, que l’équipe de Dime Web a accompagné dans la collecte et l’analyse de données d’utilisation des moteurs de recherche en vue de modéliser le bien-être au sein de différents pays. Dans un registre tout autre encore, le projet ComIngGen a bénéficié du soutien de l’instrument pour étudier dans quelle mesure la discussion sur le web a pu à la fois relayer et alimenter les débats autour des biotechnologies et des politiques publiques les encadrant.

L’instrument Web a débouché par ailleurs entre 2011 et 2020 à la création de nombreux outils numériques dédiés aux sciences sociales et réutilisables librement par tout un chacun, permettant indirectement de soutenir une vaste gamme d’utilisateurs en France et à l’international, dans les mondes académiques et pédagogiques, mais également journalistiques et associatifs. Les travaux de l’instrument ont également contribué à la recherche théorique sur les algorithmes de visualisation et la spatialisation de réseaux.

Les outils de Dime Web et notamment Hyphe sont enseignés dans des classes de Master par des enseignants-chercheurs ainsi qu’en lycée au travers du programme pédagogique IDEFI FORCCAST piloté à Sciences Po, lequel a contribué en finançant le développement de Hyphe-Browser, une interface utilisateurs complémentaire de Hyphe à visée plus pédagogique, afin de permettre aux étudiants d’utiliser l’outil directement au sein d’un navigateur web dédié.

La plupart des outils étant libres et open source, ils sont régulièrement utilisés, téléchargés et installés comme à UCLA (USA), King’s College (Royaume Uni), Aalborg University et ITU (Danemark), UNIL (Suisse), FMSH, EHESS, TGIR HumaNum, Universités de Lille 3, Rennes 2, Paris Nanterre, Paris Descartes et Paris-Est Marne La Vallée (France). S’ajoutent également plusieurs cas d’usage de Hyphe par des chercheurs sans contact avec l’équipe ou des acteurs hors du cadre académique : un chercheur a par exemple publié dans une conférence une étude de l’extrême droite allemande utilisant Hyphe, les activistes d’Utopies Concrètes ont réalisé une cartographie du monde associatif, une analyse des controverses sur la guerre aux drogues avec Hyphe a été repérée sur Medium, etc.

Pérennisation

Le succès des différents outils développés par l’équipe Dime Web auprès de communautés tant académiques que pédagogiques a permis d’identifier le besoin de pérenniser ceux-ci en leur assurant une vie au-delà de l’Equipex DIME-SHS et ainsi permettre à d’autres futurs projets de pouvoir les utiliser sans nécessairement bénéficier d’un accompagnement privilégié. Suivant la recommandation du rapport de l’ANR, l’équipe web a donc concentré ses efforts lors des dernières années du projet sur la maintenance, la consolidation et la documentation du catalogue d’outils et méthodes open source afin de leur assurer une vie au-delà de l’Equipex.

Pour un certain nombre des outils développés, et notamment les plus légers d’entre eux directement utilisables en ligne via une interface web, le développement et la publication en Open Source ont permis d’assurer une telle pérennisation par la seule préparation et rédaction de documentation des usages.

L’objectif s’avérait en revanche plus complexe à atteindre pour les outils plus ambitieux tels que Hyphe ou Gazouilloire : bien qu’également open source, ces outils restaient des logiciels difficiles à installer sans un minimum de connaissances informatiques, rebutant souvent les utilisateurs et pouvant rapidement se révéler très gourmands en temps de calcul et en volume de stockage. Ainsi, un effort important a été engagé lors des dernières années afin d’adapter Hyphe pour permettre un passage à l’échelle et une diffusion plus large en automatisant son déploiement sur le cloud directement depuis l’interface du Hyphe-Browser, et ainsi permettre à tout un chacun d’héberger Hyphe pour un coût modique pour ses propres besoins.

De même, l’équipe Dime Web a refondu profondément l’architecture du logiciel Gazouilloire de collecte longitudinale de tweets afin de rendre son installation et son utilisation accessibles à un bien plus large public, ainsi que d’ouvrir la possibilité simplifiée de connecter ces collectes à des outils qualitatifs de sélection et de catégorisation, et quantitatifs d’exploration visuelle.

La pérennisation par Sciences Po des emplois des ingénieurs de l’équipe Web au sein du médialab permet enfin d’assurer une maintenance à plus long terme de ces différents logiciels ainsi que la production de nouveaux outils libres et open source permettant la mise en œuvre de méthodes numériques dans le cadre des Sciences Humaines et Sociales. L’accompagnement des SHS aux méthodes numériques et le développement d’outils pour exploiter le web comme terrain d’enquêtes se poursuit ainsi au-delà de l’instrument Dime Web au sein du médialab de Sciences Po et de sa communauté d’utilisateurs et partenaires.