10 curiosidades sobre o novo modelo de linguagem IA da Meta

Acessibilidade

Yves Herman/Reuters

O Llama 2 será diferente da primeira versão, que até o momento só existe no formato pago

No dia 18 de julho, a Meta lançou a segunda versão do modelo de linguagem grande (LLM), conhecido popularmente como Llama. Ao contrário de seu antecessor, o Llama 2 está disponível gratuitamente para pesquisa e uso comercial. Por causa de suas impressionantes capacidades, o serviço baseado em inteligência artificial tem causado um grande rebuliço na comunidade de IA generativa.

Leia também:

Aqui estão 10 fatos sobre o modelo Llama 2:

1.

O modelo Llama 2 vem com uma licença que permite à comunidade usar, reproduzir, distribuir, copiar, criar trabalhos derivados e fazer modificações nos Materiais Llama publicados pela Meta. Embora possa não se qualificar como uma licença de código aberto, ela permite o uso comercial com algumas restrições.

2.

O modelo Llama 2 está disponível em três versões, cada uma com um número diferente de parâmetros – 7B, 13B e 70B. Quanto maior o valor do parâmetro, mais preciso é o modelo. Um tamanho de parâmetro maior indica respostas mais precisas e confiáveis.

3.

Cada versão do modelo Llama 2 tem uma variante otimizada para conversas úteis na construção de chatbots que imitam o ChatGPT. Os LLMs ajustados, chamados Llama-2-Chat, são otimizados para casos de uso de diálogo.

4.

O modelo Llama 2 é treinado em uma mistura de dados on-line disponíveis publicamente. Durante o treinamento, as palavras são convertidas em uma representação numérica chamada tokens. Os modelos Llama 2 são treinados em 2 trilhões de tokens, o que se traduz em um enorme conjunto de dados de treinamento. Todos os tipos e variantes do modelo suportam um tamanho de token de entrada de 4K, que se traduz aproximadamente em 3.500 palavras.

5.

No Microsoft Inspire, Satya Nadella anunciou que a Microsoft é o parceiro preferencial do Llama 2. O modelo agora está disponível no catálogo de modelos de IA do Azure, permitindo que os desenvolvedores do Microsoft Azure criem com ele e aproveitem as ferramentas nativas da nuvem para filtragem de conteúdo e segurança características.

6.

O Llama 2 é otimizado para ser executado localmente no Windows, fornecendo aos desenvolvedores um fluxo de trabalho simplificado à medida que eles fornecem experiências de IA generativas para clientes em várias plataformas. Os desenvolvedores do Windows podem até ajustar o modelo para atender às suas necessidades específicas diretamente em seus PCs usando o subsistema do Windows para Linux e GPUs poderosas.

7.

A Meta também está disponibilizando o modelo Llama 2 na AWS. Os clientes podem usar o Amazon SageMaker Jumpstart para implantar e realizar inferências. Os modelos Llama 2 estão disponíveis imediatamente nas regiões us-east 1 e us-west 2 da AWS.

8.

A Qualcomm anunciou que disponibilizará o modelo Llama 2 em dispositivos móveis e desktops com Snapdragon no início de 2024. Isso trará o poder da IA generativa para dispositivos com um fator de forma menor.

9.

A Meta afirma que o Llama 2 oferece o melhor desempenho e precisão da categoria em comparação com outros modelos comerciais e de código aberto. Atualmente, está no topo das paradas na tabela de classificação LLM aberta mantida por Hugging Face.

10.

O modelo Llama 2 pode ser acessado instantaneamente em https://llama2.ai e https://replicate.com/replicate/llama-7b. O primeiro é desenvolvido e hospedado pela Andreessen Horowitz, enquanto o último é disponibilizado pela Replicate, uma plataforma para implantar e executar modelos de IA.

*Janakiram MSV é analista, consultor e arquiteto da Janakiram & Associates.

(traduzido por Andressa Barbosa)

Siga o canal da Forbes no WhatsApp e receba as principais notícias de empreendedorismo, carreira, tecnologia, agro e lifestyle.