pcguia.pt - 14 ago. 18:00
Reddit “fecha a torneira” do Wayback Machine às empresas de inteligência artificial
Reddit “fecha a torneira” do Wayback Machine às empresas de inteligência artificial
É outro episódio da "luta" entre sites e plataformas de IA que indexam conteúdos sem autorização expressa e/ou pagamento de uma contrapartida.
É outro episódio da “luta” entre sites e plataformas de IA que indexam conteúdos sem autorização expressa e/ou pagamento de uma contrapartida. Desta vez, foi (mais uma vez) o Reddit a denunciar um caso destes: detectou empresas de IA a recolher dados seus a partir da Wayback Machine, do Internet Archive.
- Publicidade -Assim, os responsáveis por este fórum começaram a impedir a Wayback Machine, já esta semana, de indexar a «maioria do site»; a única excepção é a homepage do Reddit. Isto significa que, na prática, o Internet Archive apenas vai poder guardar os «títulos de notícias e publicações mais populares num determinado dia».
«O Internet Archive fornece um serviço à Web aberta, mas fomos alertados para casos em que empresas de IA violam as políticas da plataforma, incluindo as nossas, e recolhem dados da Wayback Machine», disse o porta-voz Tim Rathschmidt em declarações ao The Verge.
Nos últimos tempos, o Reddit tem cortado acesso aos web crawlers de empresas de IA que não entrem num acordo para treinar os seus LLM com os conteúdos deste fórum e chegou mesmo a processar a Anthropic (dona do Claude), em Junho deste ano. Actualmemte, o Reddit tem acordos pagos com a Google e OpenAI onde autoriza a recolha de dados.