Les archives numériques de notre histoire sont confrontées à une contraction discrète mais significative. Un nombre croissant de grands médias et de plateformes sociales bloquent activement la Wayback Machine d’Internet Archive, un outil devenu un pilier essentiel du journalisme responsable et de la préservation historique.
L’ironie du blocus
La tension entre les éditeurs et Internet Archive a atteint un point critique. Une enquête récente de USA Today est un parfait exemple de ce paradoxe : les journalistes ont utilisé la Wayback Machine pour suivre comment l’Immigration and Customs Enforcement (ICE) des États-Unis a retardé la divulgation des statistiques de détention.
L’ironie, a souligné le directeur d’Internet Archive, Mark Graham, est que même si USA Today Co. s’est appuyée sur Wayback Machine pour élaborer son rapport, la société, ainsi que plusieurs autres géants des médias, a simultanément décidé d’empêcher l’outil d’archiver son propre contenu.
Une tendance croissante des murs numériques
Le mouvement visant à restreindre la Wayback Machine n’est pas isolé d’un seul point de vente. Selon les données de la startup Originality AI, au moins 23 sites d’information majeurs bloquent actuellement « ia_archiverbot », le robot d’exploration spécifique utilisé par Internet Archive.
- Le New York Times : a mis en place des blocages, citant des inquiétudes quant au fait que son contenu soit utilisé par des sociétés d’IA pour former des modèles en violation de la loi sur le droit d’auteur.
- Reddit : A également bloqué le robot d’exploration, citant des problèmes similaires liés à l’IA.
- The Guardian : Sans bloquer entièrement le robot d’exploration, il limite l’accès en excluant le contenu de l’API d’Internet Archive et en filtrant les articles de l’interface de Wayback Machine, ce qui rend la récupération plus difficile pour le public.
- USA Today Co. : affirme que ses restrictions font partie d’une stratégie plus large visant à bloquer tous les « bots de grattage » plutôt que de cibler spécifiquement les archives.
Le conflit de l’IA : préservation contre protection
Le principal moteur de cette tendance est la guerre juridique et économique en cours entre les éditeurs et les sociétés d’intelligence artificielle.
Les développeurs d’IA ont besoin d’ensembles de données massifs pour former de grands modèles de langage. Parce que la Wayback Machine contient un billion de pages Web archivées, c’est une mine d’or pour le grattage de données. Les éditeurs soutiennent que permettre aux archives d’explorer leurs sites fournit une « porte dérobée » aux sociétés d’IA pour ingérer du matériel protégé par le droit d’auteur sans compensation, créant potentiellement des outils qui concurrencent directement les médias d’information originaux.
L’impact sur le journalisme et la responsabilité
Alors que les éditeurs luttent pour protéger leur propriété intellectuelle, de nombreux journalistes affirment que ces restrictions portent atteinte aux fondements mêmes d’une presse libre.
Une coalition de plus de 100 journalistes, dont des personnalités de premier plan comme Rachel Maddow, s’est mobilisée pour soutenir Internet Archive. Ils soutiennent qu’à mesure que les journaux locaux ferment et que les reportages uniquement numériques deviennent la norme, la Wayback Machine est la seule « bibliothèque publique » fiable qui reste pour sauvegarder les archives historiques.
Les conséquences de ces blocages vont au-delà de la simple nostalgie :
– Vérification des faits : Les journalistes utilisent les archives pour vérifier les anciennes affirmations et faire apparaître des fichiers audio ou textes supprimés.
– Droits du travail : Les organisateurs syndicaux utilisent des offres d’emploi archivées pour suivre les modifications des tâches et les fluctuations des salaires au fil du temps.
– Journalisme de surveillance : La Wayback Machine a été utilisée pour dénoncer les cas où les agences de presse modifient les titres ou le contenu après la publication (comme le montre une controverse de 2016 impliquant le New York Times ).
– Preuves juridiques : les pages archivées sont fréquemment citées comme preuve dans les litiges américains ; perdre cet accès pourrait affaiblir la capacité du système juridique à vérifier les vérités numériques.
“Le verrouillage généralisé d’une part croissante du Web public a un impact sur la capacité de la société à comprendre ce qui se passe dans notre monde.” — Mark Graham, Archives Internet
Conclusion
La lutte entre la protection du droit d’auteur à l’ère de l’IA et la préservation d’une histoire numérique transparente crée un conflit fondamental. Si les principaux médias continuent de cloisonner leur contenu, le monde risque de perdre la capacité de suivre l’évolution de la vérité, laissant aux générations futures une compréhension fragmentée et incomplète de notre ère numérique.



















