Het digitale archief van onze geschiedenis wordt geconfronteerd met een stille maar aanzienlijke inkrimping. Een groeiend aantal grote mediaorganisaties en sociale platforms blokkeren actief de Internet Archive’s Wayback Machine, een instrument dat een essentiële pijler is geworden van verantwoordingsjournalistiek en historisch behoud.
De ironie van de blokkade
De spanning tussen uitgevers en het internetarchief heeft een omslagpunt bereikt. Een recent onderzoek van USA Today is een perfect voorbeeld van deze paradox: journalisten gebruikten de Wayback Machine om bij te houden hoe de Amerikaanse immigratie- en douanehandhaving (ICE) de openbaarmaking van detentiestatistieken heeft uitgesteld.
De ironie, opgemerkt door Mark Graham, directeur van Internet Archive, is dat terwijl USA Today Co. voor het opstellen van hun rapport op de Wayback Machine vertrouwde, het bedrijf – samen met verschillende andere mediagiganten – tegelijkertijd stappen heeft ondernomen om de tool te blokkeren van het archiveren van zijn eigen inhoud.
Een groeiende trend van digitale muren
De beweging om de Wayback Machine te beperken is niet geïsoleerd tot een enkel stopcontact. Volgens gegevens van de startup Originality AI blokkeren minstens 23 grote nieuwssites momenteel ia_archiverbot, de specifieke crawler die door het internetarchief wordt gebruikt.
- The New York Times: Heeft blokkades geïmplementeerd, waarbij de bezorgdheid wordt geuit dat de inhoud ervan door AI-bedrijven wordt gebruikt om modellen te trainen die in strijd zijn met de auteursrechtwetgeving.
- Reddit: Heeft de crawler ook geblokkeerd, onder verwijzing naar vergelijkbare AI-gerelateerde problemen.
- The Guardian: Hoewel de crawler niet volledig wordt geblokkeerd, wordt de toegang beperkt door inhoud uit te sluiten van de API van Internet Archive en door artikelen uit de Wayback Machine-interface te filteren, waardoor het ophalen moeilijker wordt voor het publiek.
- USA Today Co.: beweert dat de beperkingen deel uitmaken van een bredere strategie om alle “scraping bots” te blokkeren in plaats van zich specifiek op het archief te richten.
Het AI-conflict: behoud versus bescherming
De belangrijkste motor achter deze trend is de aanhoudende juridische en economische oorlog tussen uitgevers en bedrijven op het gebied van kunstmatige intelligentie.
AI-ontwikkelaars hebben enorme datasets nodig om grote taalmodellen te trainen. Omdat de Wayback Machine een biljoen gearchiveerde webpagina’s bevat, is het een goudmijn voor het schrapen van gegevens. Uitgevers beweren dat het toestaan van het archief om hun sites te crawlen een “achterdeur” biedt voor AI-bedrijven om zonder compensatie auteursrechtelijk beschermd materiaal op te nemen, waardoor mogelijk tools ontstaan die rechtstreeks concurreren met de oorspronkelijke nieuwsuitzendingen.
De impact op journalistiek en verantwoording
Terwijl uitgevers vechten om hun intellectuele eigendom te beschermen, beweren veel journalisten dat deze beperkingen het fundament van een vrije pers beschadigen.
Een coalitie van ruim honderd journalisten – waaronder spraakmakende figuren als Rachel Maddow – heeft zich verenigd ter ondersteuning van het internetarchief. Ze beweren dat nu lokale kranten sluiten en uitsluitend digitale berichtgeving de norm wordt, de Wayback Machine de enige betrouwbare ‘openbare bibliotheek’ is die nog over is om het historische archief veilig te stellen.
De gevolgen van deze blokkades reiken verder dan louter nostalgie:
– Feitencontrole: Journalisten gebruiken het archief om oude claims te verifiëren en verwijderde audio of tekst naar boven te halen.
– Arbeidsrechten: Vakbondsorganisatoren gebruiken gearchiveerde vacatures om veranderingen in taken en loonschommelingen in de loop van de tijd bij te houden.
– Watchdog-journalistiek: De Wayback Machine is gebruikt om aan het licht te brengen wanneer nieuwsorganisaties de krantenkoppen of inhoud na publicatie wijzigen (zoals blijkt uit een controverse uit 2016 waarbij The New York Times betrokken was).
– Juridisch bewijs: Gearchiveerde pagina’s worden vaak aangehaald als bewijsmateriaal in Amerikaanse rechtszaken; het verlies van deze toegang zou het vermogen van het rechtssysteem om digitale waarheden te verifiëren kunnen verzwakken.
“De algemene afsluiting van een steeds groter deel van het publieke web heeft invloed op het vermogen van de samenleving om te begrijpen wat er in onze wereld gebeurt.” — Mark Graham, internetarchief
Conclusie
De strijd tussen de bescherming van het auteursrecht in het tijdperk van AI en het behoud van een transparante digitale geschiedenis creëert een fundamenteel conflict. Als grote nieuwsmedia hun inhoud blijven afschermen, dreigt de wereld het vermogen te verliezen om de evolutie van de waarheid te volgen, waardoor toekomstige generaties een gefragmenteerd en onvolledig begrip van ons digitale tijdperk overhouden.
