​​Dona do ChatGPT agora clona voz humana; entenda as aplicações possíveis

2 de abril de 2024

Conselho de administração da OpenAI Primeiro, o conselho da OpenAI demitiu repentinamente o CEO Sam Altman por uma suposta falha em ser sincero nas suas declarações ao grupo, apenas um ano após o lançamento do ChatGPT. Isso provocou um êxodo de funcionários e um impasse com a Microsoft, o maior acionista da startup de IA, que anunciou que contrataria Altman. Em poucos dias, Altman recuperou seu trono. Os perdedores: o conselho sem fins lucrativos de seis pessoas da OpenAI, que foi encarregado da difícil tarefa de garantir que sua tecnologia “beneficie toda a humanidade” enquanto Altman construía um negócio com investimento de US$ 13 bilhões da Microsoft. O facto de ele e o presidente, Greg Brockman, terem sido surpreendidos pela destituição do conselho foi a prova de uma falha de comunicação. Outro importante elemento do caos é que o cientista-chefe Ilya Sutskever ter destituído Altman e depois ter se arrependido publicamente. Enquanto Tasha McCauley, da RAND Corporation, e Helen Toner, da Universidade de Georgetown, estão fora do conselho, o CEO do Quora, Adam D’Angelo, continua no grupo. Com o antigo secretário do Tesouro Larry Summers e o empresário Bret Taylor, esse “conselho inicial” de três homens está agora encarregado de construir um board diversificado que possa liderar a corrida pela inteligência artificial sem deixar as coisas darem errado.

Logo da OpenAI - Foto: Dado Ruvic - Reuters

A OpenAI informou que também está desenvolvendo ferramentas que podem discernir se um vídeo foi gerado pelo Sora

A OpenAI, empresa criadora do ChatGPT, https://forbes.com.br/forbes-tech/2024/02/como-a-sora-da-openai-vai-mudar-o-futuro-da-musica-e-do-cinema/. Depois de lançar a Sora, plataforma que transforma comandos em vídeos realistas, agora apresenta ao mercado o Voice Engine.

Segundo a companhia, trata-se de um sistema que, por meio de uma única amostra de áudio de 15 segundos, gera falas com som natural semelhantes ao do locutor original.

  • Siga a Forbes no WhatsApp e receba as principais notícias sobre negócios, carreira, tecnologia e estilo de vida

“Desenvolvemos o Voice Engine pela primeira vez no final de 2022 e o usamos para potencializar as vozes predefinidas. Ao mesmo tempo, estamos adotando uma abordagem cautelosa e informada para uma divulgação mais ampla devido ao potencial de uso indevido de voz sintética”, defende a empresa, em texto.

Em relação às questões éticas, a OpenAI afirma que “espera iniciar um diálogo sobre a utilização responsável de vozes sintéticas e sobre como a sociedade pode adaptar-se a estas novas capacidades. Com base nestas conversas e nos resultados destes testes em pequena escala, tomaremos uma decisão mais informada sobre se e como implementar esta tecnologia em escala.”

Veja as primeiras aplicações possíveis para o recurso:

  • Assistência de leitura para pessoas com dificuldades
  • Tradução de vídeos e podcasts
  • Uso para ampliar o alcance da saúde.
  • Aplicações terapêuticas e reabilitação.
  • Recuperação de voz para pacientes.

Veja abaixo 4 apps que utilizam IA para criar fotos e vídeos além da Sora:

Starchive usa ferramentas de IA para arqueologia de conteúdo moderna.