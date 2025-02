EM ANDAMENTO

Meta baixou mais de 81 TB de livros piratas para treinar IA, dizem autores em processo

Empresa não comentou novas alegações, mas defende que o uso de dados para treinar IA é "justo"

Carol Neves

Publicado em 7 de fevereiro de 2025 às 09:27

Livro pirata Crédito: Shutterstock

Um caso de direitos autorais movido por escritores contra a Meta acusa a empresa de treinar seus modelos de Inteligência Artificial usando obras pirateadas. E-mails divulgados recentemente trariam "provas mais contundentes" da prática, de acordo com reportagem do site especializado em tecnologia Ars Technica. >

Os documentos mostram que a Meta baixou e compartilhou ilegalmente dezenas de terabytes de dados de bibliotecas clandestinas, como Z-Library e LibGen, para treinar seus sistemas de inteligência artificial. Segundo os autores, a Meta teria baixado "pelo menos 81,7 terabytes de dados de várias bibliotecas sombrias por meio do site Anna’s Archive, incluindo pelo menos 35,7 terabytes de dados da Z-Library e LibGen". Além disso, a empresa já teria baixado "80,6 terabytes de dados da LibGen".>

"A magnitude do esquema ilegal de torrent da Meta é impressionante", afirmaram os autores em documentos judiciais, destacando que "atos muito menores de pirataria de dados — apenas 0,008% do volume de obras protegidas por direitos autorais pirateadas pela Meta — já resultaram em juízes encaminhando o caso para investigação criminal". Os autores também alegam que a Meta tentou esconder suas atividades, evitando o uso de servidores do Facebook para "minimizar o risco" de rastreamento e operando em "modo sigiloso", conforme descrito em mensagens internas.>

Funcionários da Meta expressaram preocupação com as práticas. Nikolay Bashlykov, engenheiro de pesquisa da empresa, escreveu em abril de 2023: "Fazer torrents de um laptop corporativo não parece certo", acrescentando um emoji de sorriso. Ele também manifestou preocupação com o uso de endereços IP da Meta para "baixar conteúdo pirata por meio de torrents". Em setembro do mesmo ano, Bashlykov alertou a equipe jurídica sobre os riscos legais de "semear" os arquivos, ou seja, compartilhá-los externamente. No entanto, os autores alegam que a Meta ignorou esses avisos e continuou a baixar e compartilhar terabytes de dados até abril de 2024.>

Agora, os autores pedem que funcionários da Meta envolvidos na decisão de usar a LibGen sejam novamente interrogados, já que as novas evidências "contradizem depoimentos anteriores". E-mails não editados mostram que a decisão de usar a LibGen ocorreu após "uma escalada prévia para MZ" (Mark Zuckerberg), contradizendo a afirmação do CEO de que não estava envolvido. >