O registo digital da nossa história enfrenta uma contracção silenciosa mas significativa. Um número crescente de grandes organizações de mídia e plataformas sociais está bloqueando ativamente a Internet Archive’s Wayback Machine, uma ferramenta que se tornou um pilar essencial do jornalismo de responsabilização e da preservação histórica.
A Ironia do Bloqueio
A tensão entre os editores e o Internet Archive atingiu um ponto crítico. Uma investigação recente do USA Today serve como um exemplo perfeito deste paradoxo: jornalistas usaram a Wayback Machine para rastrear como o Departamento de Imigração e Alfândega dos EUA (ICE) atrasou a divulgação de estatísticas de detenção.
A ironia, observada pelo diretor do Internet Archive, Mark Graham, é que, embora a USA Today Co. tenha contado com a Wayback Machine para construir o seu relatório, a empresa – juntamente com vários outros gigantes da mídia – agiu simultaneamente para impedir que a ferramenta arquivasse seu próprio conteúdo.
Uma tendência crescente de paredes digitais
O movimento para restringir a Wayback Machine não está isolado em uma única tomada. De acordo com dados da startup Originality AI, pelo menos 23 grandes sites de notícias estão atualmente bloqueando o ia_archiverbot, o rastreador específico usado pelo Internet Archive.
- The New York Times: Implementou bloqueios, citando preocupações de que seu conteúdo esteja sendo usado por empresas de IA para treinar modelos, violando a lei de direitos autorais.
- Reddit: Também bloqueou o rastreador, citando preocupações semelhantes relacionadas à IA.
- The Guardian: Embora não bloqueie totalmente o rastreador, ele limita o acesso, excluindo conteúdo da API do Internet Archive e filtrando artigos da interface da Wayback Machine, tornando a recuperação mais difícil para o público.
- USA Today Co.: Afirma que suas restrições fazem parte de uma estratégia mais ampla para bloquear todos os “bots de raspagem” em vez de visar especificamente o Arquivo.
O conflito da IA: preservação versus proteção
O principal impulsionador desta tendência é a guerra jurídica e económica em curso entre editores e empresas de Inteligência Artificial.
Os desenvolvedores de IA exigem conjuntos de dados massivos para treinar grandes modelos de linguagem. Como a Wayback Machine contém um trilhão de páginas da web arquivadas, é uma mina de ouro para coleta de dados. Os editores argumentam que permitir que o Archive rastreie seus sites fornece uma “porta dos fundos” para as empresas de IA ingerirem material protegido por direitos autorais sem compensação, criando potencialmente ferramentas que competem diretamente com os meios de comunicação originais.
O impacto no jornalismo e na responsabilização
Enquanto os editores lutam para proteger a sua propriedade intelectual, muitos jornalistas argumentam que estas restrições estão a prejudicar os próprios alicerces de uma imprensa livre.
Uma coligação de mais de 100 jornalistas – incluindo figuras de destaque como Rachel Maddow – reuniu-se em apoio ao Internet Archive. Eles argumentam que, à medida que os jornais locais fecham e as reportagens apenas digitais se tornam a norma, a Wayback Machine é a única “biblioteca pública” confiável que resta para salvaguardar o registro histórico.
As consequências desses bloqueios vão além da mera nostalgia:
– Verificação de fatos: Jornalistas usam o Arquivo para verificar afirmações antigas e revelar áudio ou texto excluído.
– Direitos Trabalhistas: Os organizadores sindicais usam listas de empregos arquivadas para rastrear mudanças nas obrigações e flutuações salariais ao longo do tempo.
– Jornalismo Watchdog: A Wayback Machine tem sido usada para expor quando as organizações de notícias mudam as manchetes ou o conteúdo após a publicação (como visto em uma controvérsia de 2016 envolvendo o The New York Times ).
– Evidências legais: páginas arquivadas são frequentemente citadas como evidências em litígios nos EUA; perder este acesso poderia enfraquecer a capacidade do sistema jurídico de verificar verdades digitais.
“O bloqueio geral de cada vez mais redes públicas está afetando a capacidade da sociedade de entender o que está acontecendo em nosso mundo.” — Mark Graham, Arquivo da Internet
Conclusão
A luta entre a protecção dos direitos de autor na era da IA e a preservação de uma história digital transparente está a criar um conflito fundamental. Se os principais meios de comunicação continuarem a isolar o seu conteúdo, o mundo corre o risco de perder a capacidade de acompanhar a evolução da verdade, deixando as gerações futuras com uma compreensão fragmentada e incompleta da nossa era digital.
