Sora, da OpenAI, transforma texto em vídeo com uso de IA

Acessibilidade

Reprodução/OpenAI

Sam Altman, CEO da OpenAI, está postando vídeos bizarros criados pelo Sora com sugestões recebidas nas redes socais

A nova ferramenta de inteligência artificial generativa da OpenAI, Sora, revelada na última quinta-feira (15), ainda não tem data de lançamento, mas aqueles que desejam brincar com ela podem compartilhar suas instruções de texto para geração de vídeo diretamente com o CEO da empresa, que está postando os resultados nas redes sociais.

“Queremos mostrar o que Sora pode fazer”, escreveu Sam Altman no X, antigo Twitter, depois que a OpenAI anunciou o produto. “Por favor, responda com legendas para os vídeos que você gostaria de ver e começaremos a fazer alguns.”

Siga a Forbes no WhatsApp e receba as principais notícias sobre negócios, carreira, tecnologia e estilo de vida

Até a publicação desta matéria, o tweet havia tido cerca de 15 mil comentários, alguns já com sugestões que transitam entre o bizarro e o artístico, o sério e o sarcástico.

De acordo com a OpenAI, a nova ferramenta pode gerar vídeos de até um minuto apresentando “cenas altamente detalhadas, movimentos de câmera complexos e vários personagens com emoções vibrantes”.

Na quinta-feira, a empresa compartilhou no X uma série de vídeos gerados pelo Sora: uma cena da cidade de Tóquio movimentada e com neve; um mundo de papel com um recife de coral cheio de criaturas marinhas coloridas e um monstrinho ajoelhado ao lado de uma vela vermelha derretida.

Então Altman convidou o público a participar, e esta foi uma das instruções que recebeu:

“Um rebanho de quatro lindos cavalos de corrida hiper-realistas, cada um montando um astronauta vestindo uma jaqueta Balenciaga fofa, em cima de uma sela com tema de abacate, cada cavalo com texto sobreposto representando os nomes exatos de cada um dos quatro Cavaleiros do Apocalipse. Situado em uma sala vazia, sem absolutamente nenhum elefante, nenhum elefante em qualquer lugar da sala, um drone FPV dinâmico filmado em 8k, começando amplo e depois ampliando profundamente para olhar de perto as mãos sem luvas detalhadas de cada astronauta.”

Leia também:

Aqui estão alguns dos vídeos gerados pelo Sora que Altman postou com base nas sugestões do público. Se você sempre quis ver golfinhos e pinguins andando de bicicleta na superfície do oceano ou golden retrievers apresentando um podcast, este é seu dia de sorte.

https://t.co/qbj02M4ng8 pic.twitter.com/EvngqF2ZIX

— Sam Altman (@sama) February 15, 2024

https://t.co/uCuhUPv51N pic.twitter.com/nej4TIwgaP

— Sam Altman (@sama) February 15, 2024

https://t.co/rmk9zI0oqO pic.twitter.com/WanFKOzdIw

— Sam Altman (@sama) February 15, 2024

Não à toa, o convite de Altman também levou as pessoas a zombar da OpenAI. Particularmente em relação ao drama que tomou conta da empresa no ano passado, quando Altman, fundador e CEO, foi demitido pelo conselho, o que gerou uma revolta de funcionários e motivou seu retorno ao cargo alguns dias depois.

Esta foi uma das sugestões sobre o tema: “Sam Altman sentado em orientação para novos funcionários da Microsoft em novembro de 2023, mexendo em seu celular em busca de atualizações sobre a OpenAI, recebendo uma mensagem de texto do conselho informando que ele estava de volta, levantando-se da cadeira e exclamando: ‘Sammy voltou, baby!’ e saindo da sala deixando os outros novos contratados confusos.”

Sora, da OpenAI, tem rivais em desenvolvimento, incluindo Google e Meta

Como a OpenAI, outras gigantes da tecnologia também estão desenvolvendo e testando ferramentas de IA para geração de vídeo.

O Google, que recentemente lançou seu modelo de inteligência artificial de última geração, o Gemini 1.5, revelou pesquisas e clipes de demonstração de seu modelo Lumiere, embora não esteja claro quando planeja disponibilizar a ferramenta publicamente. A empresa também ressaltou a necessidade de ferramentas robustas para combater vieses para garantir que sua tecnologia possa ser implantada com segurança.

A Meta, que possui um conjunto de aplicativos incluindo Facebook, Instagram e WhatsApp, lançou pela primeira vez uma ferramenta de geração de vídeo em 2022, chamada Make-A-Video, que produzia conteúdo artificial, distorcido e embaçado, mas mesmo assim foi uma conquista significativa na época.

No final do ano passado, a Meta divulgou um novo modelo de transformação de texto para vídeo, o Emu Video, e disse que quase todas as pessoas que o usaram o classificaram acima do Make-A-Video em termos de qualidade e fidelidade ao prompt de texto.

Embora não tenha dado indicação de quando a ferramenta será lançada, o CEO Mark Zuckerberg afirmou que o Emu será integrado ao Facebook e Instagram.

A startup de IA de Elon Musk, xAI, que espera rivalizar com líderes do setor como DeepMind e OpenAI, não anunciou planos para um gerador de texto em vídeo, embora seja possível que integre algo parecido ao seu chatbot de IA Grok no futuro.

Já a Amazon fez uma pré-apresentação de um chatbot de IA generativa para trabalhadores, o Q, e um gerador de imagens de IA, embora a gigante do e-commerce não tenha divulgado quando planeja lançar as ferramentas ou se geradores de vídeo mais avançados estão a caminho.

IA e segurança

As ferramentas de IA generativa estão gerando uma série de respostas do público, desde o entusiasmo pelas possibilidades criativas até raiva pela possível violação de direitos autorais e o medo do impacto sobre profissionais da indústria criativa – e sobre a própria criatividade.
O Sora não é diferente. “Hollywood está prestes a implodir”, escreveu um usuário do X em resposta à chegada do Sora.

A OpenAI disse que precisa concluir as verificações de segurança antes de disponibilizar a ferramenta publicamente. Especialistas em áreas como desinformação, conteúdo de ódio e vieses na tecnologia estarão testando “contrariamente” o modelo, disse a empresa em uma postagem no seu blog.

“Apesar de extensas pesquisas e testes, não podemos prever todas as maneiras benéficas pelas quais as pessoas usarão nossa tecnologia, nem todas as maneiras pelas quais as pessoas irão abusar dela”, disse a OpenAI. “É por isso que acreditamos que aprender com o uso no mundo real é um componente crítico para criar e lançar sistemas de IA cada vez mais seguros ao longo do tempo.”

*Leslie Katz é colaboradora da Forbes US. Ela é uma jornalista com experiência em arte, ciência, saúde, religião e espiritualidade.

Siga o canal da Forbes no WhatsApp e receba as principais notícias de empreendedorismo, carreira, tecnologia, agro e lifestyle.