A Meta usou conteúdos públicos do Facebook e do Instagram para treinar seu novo assistente virtual, o chatbot Meta AI, mas dispensou publicações privadas compartilhadas apenas com familiares e amigos para respeitar a privacidade dos consumidores, disse um executivo da empresa em entrevista à Reuters.
A gigante das redes sociais também não usou bate-papos particulares como dados de treinamento para o modelo e tomou medidas para filtrar detalhes privados de conjuntos de dados públicos utilizados para treinamento, disse o presidente para assuntos globais da Meta, Nick Clegg, nos bastidores da conferência anual da empresa essa semana.
Leia também
- 10 curiosidades sobre o novo modelo de linguagem IA da Meta
- Com a entrada da Meta, corrida da IA fica ainda mais acirrada
“Tentamos excluir conjuntos de dados com grande preponderância de informações pessoais”, disse Clegg, acrescentando que a “grande maioria” dos dados utilizados pela Meta estava disponível publicamente.
Ele citou o LinkedIn como exemplo de site cujo conteúdo a Meta deliberadamente optou por não usar, por questões de privacidade.
Os comentários de Clegg ocorrem no momento em que empresas de tecnologia, como Meta, OpenAI e Google, da Alphabet, têm sido criticadas por usarem informações coletadas da internet sem permissão para treinar seus modelos de IA.
Os conteúdos públicos do Facebook e do Instagram usados para treinar o Meta AI incluíam texto e fotos, disse Clegg.
Ele disse que a empresa também impôs restrições de segurança sobre o conteúdo que a ferramenta pode gerar, como a proibição da criação de imagens fotorrealistas de figuras públicas.
Um porta-voz da Meta, questionado se a empresa havia tomado medidas para evitar a reprodução de imagens protegidas por direitos autorais, apontou novos termos de serviço que proíbem os usuários de gerar conteúdo que viole a privacidade e os direitos de propriedade intelectual.