Na quarta-feira, o Reddit processou a Anthropic por suposta quebra de contrato, alegando que a startup de IA treinou seus modelos com dados pessoais de usuários do Reddit sem permissão e continuou a fazê-lo, apesar de informar ao Reddit, que fechou acordos de licenciamento com a OpenAI e o Google, que a empresa havia parado.
O processo do Reddit, aberto no Tribunal Superior da Califórnia, Condado de São Francisco, acusou a Anthropic de “atos comerciais ilegais e injustos” depois que a empresa “treinou intencionalmente” seus modelos com dados de usuários do Reddit “sem nunca solicitar seu consentimento” ou pagar por isso.
O Reddit alertou a Anthropic sobre o uso de seus dados e tentou iniciar negociações de licenciamento, embora a Anthropic tenha se recusado e dito ao Reddit que a empresa deixaria de acessar os servidores da plataforma de mídia social, alega o Reddit.
De acordo com a denúncia, a Anthropic continuou acessando os servidores do Reddit mais de 100.000 vezes depois que a empresa informou o contrário ao Reddit. O Reddit solicitou que os danos fossem determinados após um julgamento com júri e uma liminar que impediria a Anthropic de acessar dados de usuários do Reddit ou usar dados mais antigos para novos produtos. A Anthropic não respondeu imediatamente a um pedido de comentário.
“A Anthropic é, na verdade, intencionalmente treinada com os dados pessoais dos usuários do Reddit sem nunca solicitar seu consentimento”, afirma o Reddit, chamando a Anthropic de uma empresa “de crescimento tardio” que “se autodenomina a cavaleira branca da indústria de IA”.
Os fóruns de décadas do Reddit têm sido alvo de várias empresas de IA para treinamento de modelos nos últimos anos. O CEO e cofundador Steve Huffman disse ao The Wall Street Journal no ano passado que o Reddit inicialmente cedeu seus dados gratuitamente antes de perceber que as empresas de IA estavam envolvidas em uma “corrida armamentista”, dizendo mais tarde que o Reddit estava “em negociações com quase todo mundo” para acordos de licenciamento.
As empresas de IA dependem de “inteligência real” para treinar seus modelos, disse Huffman, “que é o que você encontra no Reddit” em centenas de milhares de fóruns de subreddit. A OpenAI e o Reddit anunciaram uma parceria em maio, que a OpenAI disse que “aprimoraria” seu chatbot de IA ChatGPT. O acordo ocorreu após um acordo de US$ 60 milhões para o Google treinar seus modelos de IA usando as postagens do Reddit, e o Reddit fechou parcerias de acesso a dados com as empresas de software Sprinklr e Cision.