Internet Wayback Machine: bloqueios deixam ' máquina do tempo' da web em risco Há 12 horas
Os bloqueios realizados por veículos de comunicação e plataformas digitais estão colocando em risco a missão de preservar a história da internet assumida pela plataforma Wayback Machine.
O projeto, lançado em 1996, possui mais de 1 trilhão de páginas arquivadas.
Como destacou a Wired na segunda-feira (13), mais de 20 grandes sites de notícias estão bloqueando o rastreador web utilizado pela organização sem fins lucrativos Internet Archive, que mantém o banco de dados digital, para buscar os conteúdos.
O uso não autorizado de conteúdos protegidos por direitos autorais para o treinamento de modelos de IA é o que motivou os bloqueios de veículos de imprensa.
A prática já resultou em processos contra startups de IA, como o aberto pelo The New York Times tendo a Open AI como alvo .
O relatório aponta, ainda, o The Guardian como outro grande veículo com restrições ao mecanismo.
O jornal britânico exclui seu conteúdo da API do Internet Archive e filtra notícias da interface do Wayback Machine , dificultando o acesso às versões arquivadas.
Também há menção ao Reddit, que implementou o bloqueio da raspagem de dados e comentários em meados do ano passado.
Na ocasião, a rede social alegou que empresas de IA se aproveitavam do banco de dados digital para violar políticas de privacidade e acessar as conversas de usuários.
Temendo que os bloqueios causem danos históricos ao impedir o arquivamento de páginas, o diretor do Wayback Machine , Mark Graham, disse que a plataforma tenta reverter o cenário.
Há conversas em andamento com o Times e outros veículos na tentativa de fazê-los mudar de ideia.