Com o Gemini, Google planeja superar definitivamente o ChatGPT

8 de dezembro de 2023
Getty Images

O Google Gemini foi criado para ser um modelo multimodal nativo, ou seja, treinado desde o início em diferentes modalidades.

O Google lançou seu modelo de IA mais avançado em termos científicos e tecnológicos, o Gemini. A nova ferramenta de tecnologia operacional utiliza inteligência artificial multimodal para desempenhar tarefas de alta complexidade, como organizar, compreender, operar e combinar textos, imagens, áudios, vídeos e linguagens de programação.

  • Siga a Forbes no WhatsApp e receba as principais notícias sobre negócios, carreira, tecnologia e estilo de vida

“O Gemini pode compreender o mundo que nos rodeia da mesma forma que nós”, disse à Forbes USA, Demis Hassabis, fundador do DeepMind, o laboratório de IA do Google que criou o modelo, acrescentando que o Gemini é melhor do que qualquer outro modelo existente.

Leia também:

O Google Gemini já está disponível para os usuários do Bard, o chatbot da empresa, reafirmando a aposta da Big Tech em superar seu maior concorrente em IA, o ChatGPT, chatbot da OpenAI. “Essa é a maior melhoria de qualidade do Bard desde o seu lançamento”, diz o comunicado do Google à imprensa.

Nos próximos meses, o Gemini 1.0, que conta com três tamanhos (descritos abaixo), estará disponível em outros produtos e serviços do Google, como o Ads, Chrome e Duet AI.

  1. Gemini Ultra, a versão completa para lidar com tarefas altamente complexas;
  2. Gemini Pro, adequado para lidar com uma ampla gama de tarefas;
  3. Gemini Nano, o modelo mais eficiente para realizar tarefas em dispositivos.

O Google afirma que o Gemini tem 5 vezes o poder computacional do GPT-4, além de ser o primeiro modelo a superar os especialistas humanos em Massive Multitask Language Understanding (Compreensão de Linguagem Multitarefa em Grande Escala, em tradução livre), um dos métodos mais populares para testar o conhecimento e as habilidades de resolução de problemas dos modelos de IA.

O desempenho do Gemini Ultra, por exemplo, alcança 30 dos 32 pontos nos testes com referências acadêmicas utilizadas na pesquisa e no desenvolvimento de grandes modelos de linguagem.

Esse é também o modelo de IA mais flexível do Google, capaz de funcionar com eficiência desde dispositivos móveis até data centers.

Afinal, por que o Gemini é tão inovador?

O método padrão para a criação de modelos multimodais de IA, envolve treinar informações separadas para diferentes modalidades e depois juntá-las. Esses padrão pode ser bom na execução de certas tarefas, como descrever imagens, mas enfrentam problemas com comandos mais conceituais e complexos.

O Gemini foi criado para ser um modelo multimodal nativo, ou seja, treinado desde o início em diferentes modalidades. Isso ajuda o Gemini a compreender e raciocinar com qualidade sobre todos os tipos de informações desde o início do comando.

Além dos fatores de treinamento e teste, o Gemini também possui uma vantagem exclusiva, o Google utilizou chips projetados internamente para produzir seu novo modelo de IA.

Para clientes corporativos e desenvolvedores:

A partir do dia 13 de dezembro, desenvolvedores e clientes corporativos poderão acessar o Gemini Pro por meio da API (interface de programação de aplicações) no Google AI Studio ou Vertex AI.

O Google AI Studio é uma ferramenta gratuita para desenvolvedores, feita para auxiliar os usuários com a criação de protótipos e lançamento de aplicativos.

A Vertex AI permite a personalização do Gemini com controle total de dados e se beneficia de recursos adicionais do Google Cloud para segurança, privacidade e conformidade de dados.

E não para por aí, o Google irá lançar o Bard Advanced, uma nova experiência de IA avançada, no início de 2024.