O Google lançou seu modelo de IA mais avançado em termos científicos e tecnológicos, o Gemini. A nova ferramenta de tecnologia operacional utiliza inteligência artificial multimodal para desempenhar tarefas de alta complexidade, como organizar, compreender, operar e combinar textos, imagens, áudios, vídeos e linguagens de programação.
-
Siga a Forbes no WhatsApp e receba as principais notícias sobre negócios, carreira, tecnologia e estilo de vida
“O Gemini pode compreender o mundo que nos rodeia da mesma forma que nós”, disse à Forbes USA, Demis Hassabis, fundador do DeepMind, o laboratório de IA do Google que criou o modelo, acrescentando que o Gemini é melhor do que qualquer outro modelo existente.
Leia também:
- Governos espionam usuários da Apple e Google por meio de notificações, diz senador dos EUA
- 5 recursos de segurança online para reservas de fim de ano no Airbnb
- O problema do “X” é simples: o aplicativo não é inovador
O Google Gemini já está disponível para os usuários do Bard, o chatbot da empresa, reafirmando a aposta da Big Tech em superar seu maior concorrente em IA, o ChatGPT, chatbot da OpenAI. “Essa é a maior melhoria de qualidade do Bard desde o seu lançamento”, diz o comunicado do Google à imprensa.
Nos próximos meses, o Gemini 1.0, que conta com três tamanhos (descritos abaixo), estará disponível em outros produtos e serviços do Google, como o Ads, Chrome e Duet AI.
- Gemini Ultra, a versão completa para lidar com tarefas altamente complexas;
- Gemini Pro, adequado para lidar com uma ampla gama de tarefas;
- Gemini Nano, o modelo mais eficiente para realizar tarefas em dispositivos.
O Google afirma que o Gemini tem 5 vezes o poder computacional do GPT-4, além de ser o primeiro modelo a superar os especialistas humanos em Massive Multitask Language Understanding (Compreensão de Linguagem Multitarefa em Grande Escala, em tradução livre), um dos métodos mais populares para testar o conhecimento e as habilidades de resolução de problemas dos modelos de IA.
O desempenho do Gemini Ultra, por exemplo, alcança 30 dos 32 pontos nos testes com referências acadêmicas utilizadas na pesquisa e no desenvolvimento de grandes modelos de linguagem.
Esse é também o modelo de IA mais flexível do Google, capaz de funcionar com eficiência desde dispositivos móveis até data centers.
Afinal, por que o Gemini é tão inovador?
O método padrão para a criação de modelos multimodais de IA, envolve treinar informações separadas para diferentes modalidades e depois juntá-las. Esses padrão pode ser bom na execução de certas tarefas, como descrever imagens, mas enfrentam problemas com comandos mais conceituais e complexos.
O Gemini foi criado para ser um modelo multimodal nativo, ou seja, treinado desde o início em diferentes modalidades. Isso ajuda o Gemini a compreender e raciocinar com qualidade sobre todos os tipos de informações desde o início do comando.
Além dos fatores de treinamento e teste, o Gemini também possui uma vantagem exclusiva, o Google utilizou chips projetados internamente para produzir seu novo modelo de IA.
Para clientes corporativos e desenvolvedores:
A partir do dia 13 de dezembro, desenvolvedores e clientes corporativos poderão acessar o Gemini Pro por meio da API (interface de programação de aplicações) no Google AI Studio ou Vertex AI.
O Google AI Studio é uma ferramenta gratuita para desenvolvedores, feita para auxiliar os usuários com a criação de protótipos e lançamento de aplicativos.
A Vertex AI permite a personalização do Gemini com controle total de dados e se beneficia de recursos adicionais do Google Cloud para segurança, privacidade e conformidade de dados.
E não para por aí, o Google irá lançar o Bard Advanced, uma nova experiência de IA avançada, no início de 2024.