El registro digital de nuestra historia se enfrenta a una contracción silenciosa pero significativa. Un número creciente de importantes organizaciones de medios y plataformas sociales están bloqueando activamente la Wayback Machine de Internet Archive, una herramienta que se ha convertido en un pilar esencial del periodismo de rendición de cuentas y la preservación histórica.
La ironía del bloqueo
La tensión entre los editores e Internet Archive ha llegado a un punto de inflexión. Una investigación reciente de USA Today sirve como un ejemplo perfecto de esta paradoja: los periodistas utilizaron la Wayback Machine para rastrear cómo el Servicio de Inmigración y Control de Aduanas (ICE) de Estados Unidos retrasó la divulgación de estadísticas de detención.
La ironía, señalada por el director de Internet Archive, Mark Graham, es que mientras USA Today Co. se basó en Wayback Machine para elaborar su informe, la empresa, junto con varios otros gigantes de los medios, ha tomado simultáneamente medidas para impedir que la herramienta archive su propio contenido.
Una tendencia creciente de muros digitales
El movimiento para restringir la Wayback Machine no está aislado de una sola salida. Según datos de la startup Originality AI, al menos 23 sitios de noticias importantes están bloqueando actualmente ia_archiverbot, el rastreador específico utilizado por Internet Archive.
- The New York Times: Ha implementado bloqueos, citando preocupaciones de que su contenido esté siendo utilizado por empresas de inteligencia artificial para entrenar modelos en violación de la ley de derechos de autor.
- Reddit: También bloqueó el rastreador, citando preocupaciones similares relacionadas con la IA.
- The Guardian: Si bien no bloquea el rastreador por completo, limita el acceso al excluir contenido de la API de Internet Archive y filtrar artículos de la interfaz de Wayback Machine, lo que dificulta la recuperación para el público.
- USA Today Co.: Sostiene que sus restricciones son parte de una estrategia más amplia para bloquear todos los “robots de raspado” en lugar de apuntar específicamente al Archivo.
El conflicto de la IA: preservación versus protección
El principal impulsor de esta tendencia es la guerra legal y económica en curso entre los editores y las empresas de Inteligencia Artificial.
Los desarrolladores de IA necesitan conjuntos de datos masivos para entrenar modelos de lenguaje de gran tamaño. Debido a que Wayback Machine contiene un billón de páginas web archivadas, es una mina de oro para la extracción de datos. Los editores argumentan que permitir que el Archivo rastree sus sitios proporciona una “puerta trasera” para que las empresas de inteligencia artificial ingieran material protegido por derechos de autor sin compensación, creando potencialmente herramientas que compitan directamente con los medios de noticias originales.
El impacto en el periodismo y la rendición de cuentas
Mientras los editores luchan por proteger su propiedad intelectual, muchos periodistas sostienen que estas restricciones están dañando los cimientos mismos de una prensa libre.
Una coalición de más de 100 periodistas, incluidas figuras de alto perfil como Rachel Maddow, se ha manifestado en apoyo de Internet Archive. Argumentan que a medida que los periódicos locales cierran y la información exclusivamente digital se convierte en la norma, Wayback Machine es la única “biblioteca pública” confiable que queda para salvaguardar el registro histórico.
Las consecuencias de estos bloqueos van más allá de la mera nostalgia:
– Verificación de hechos: Los periodistas utilizan el Archivo para verificar afirmaciones antiguas y mostrar audio o texto eliminados.
– Derechos laborales: Los organizadores sindicales utilizan listados de trabajos archivados para realizar un seguimiento de los cambios en las funciones y las fluctuaciones salariales a lo largo del tiempo.
– Periodismo de vigilancia: Wayback Machine se ha utilizado para exponer cuándo las organizaciones de noticias cambian los titulares o el contenido después de la publicación (como se vio en una controversia de 2016 que involucró a The New York Times ).
– Evidencia legal: Las páginas archivadas se citan con frecuencia como prueba en litigios estadounidenses; perder este acceso podría debilitar la capacidad del sistema legal para verificar verdades digitales.
“El bloqueo general de cada vez más sitios web públicos está afectando la capacidad de la sociedad para comprender lo que está sucediendo en nuestro mundo”. — Mark Graham, Archivo de Internet
Conclusión
La lucha entre proteger los derechos de autor en la era de la IA y preservar una historia digital transparente está creando un conflicto fundamental. Si los principales medios de comunicación continúan bloqueando su contenido, el mundo corre el riesgo de perder la capacidad de seguir la evolución de la verdad, dejando a las generaciones futuras con una comprensión fragmentada e incompleta de nuestra era digital.
