No dia 18 de julho, a Meta lançou a segunda versão do modelo de linguagem grande (LLM), conhecido popularmente como Llama. Ao contrário de seu antecessor, o Llama 2 está disponível gratuitamente para pesquisa e uso comercial. Por causa de suas impressionantes capacidades, o serviço baseado em inteligência artificial tem causado um grande rebuliço na comunidade de IA generativa.
Leia também:
- Zuckerberg e Musk começam luta e Meta lança plataforma Threads
- Entenda como funciona o algoritmo do Instagram, segundo a própria Meta
- Cinco ferramentas de IA para ajudar na sua busca de emprego
Aqui estão 10 fatos sobre o modelo Llama 2:
1.
O modelo Llama 2 vem com uma licença que permite à comunidade usar, reproduzir, distribuir, copiar, criar trabalhos derivados e fazer modificações nos Materiais Llama publicados pela Meta. Embora possa não se qualificar como uma licença de código aberto, ela permite o uso comercial com algumas restrições.
2.
O modelo Llama 2 está disponível em três versões, cada uma com um número diferente de parâmetros – 7B, 13B e 70B. Quanto maior o valor do parâmetro, mais preciso é o modelo. Um tamanho de parâmetro maior indica respostas mais precisas e confiáveis.
3.
Cada versão do modelo Llama 2 tem uma variante otimizada para conversas úteis na construção de chatbots que imitam o ChatGPT. Os LLMs ajustados, chamados Llama-2-Chat, são otimizados para casos de uso de diálogo.
4.
O modelo Llama 2 é treinado em uma mistura de dados on-line disponíveis publicamente. Durante o treinamento, as palavras são convertidas em uma representação numérica chamada tokens. Os modelos Llama 2 são treinados em 2 trilhões de tokens, o que se traduz em um enorme conjunto de dados de treinamento. Todos os tipos e variantes do modelo suportam um tamanho de token de entrada de 4K, que se traduz aproximadamente em 3.500 palavras.
5.
No Microsoft Inspire, Satya Nadella anunciou que a Microsoft é o parceiro preferencial do Llama 2. O modelo agora está disponível no catálogo de modelos de IA do Azure, permitindo que os desenvolvedores do Microsoft Azure criem com ele e aproveitem as ferramentas nativas da nuvem para filtragem de conteúdo e segurança características.
6.
O Llama 2 é otimizado para ser executado localmente no Windows, fornecendo aos desenvolvedores um fluxo de trabalho simplificado à medida que eles fornecem experiências de IA generativas para clientes em várias plataformas. Os desenvolvedores do Windows podem até ajustar o modelo para atender às suas necessidades específicas diretamente em seus PCs usando o subsistema do Windows para Linux e GPUs poderosas.
7.
A Meta também está disponibilizando o modelo Llama 2 na AWS. Os clientes podem usar o Amazon SageMaker Jumpstart para implantar e realizar inferências. Os modelos Llama 2 estão disponíveis imediatamente nas regiões us-east 1 e us-west 2 da AWS.
8.
A Qualcomm anunciou que disponibilizará o modelo Llama 2 em dispositivos móveis e desktops com Snapdragon no início de 2024. Isso trará o poder da IA generativa para dispositivos com um fator de forma menor.
9.
A Meta afirma que o Llama 2 oferece o melhor desempenho e precisão da categoria em comparação com outros modelos comerciais e de código aberto. Atualmente, está no topo das paradas na tabela de classificação LLM aberta mantida por Hugging Face.
10.
O modelo Llama 2 pode ser acessado instantaneamente em https://llama2.ai e https://replicate.com/replicate/llama-7b. O primeiro é desenvolvido e hospedado pela Andreessen Horowitz, enquanto o último é disponibilizado pela Replicate, uma plataforma para implantar e executar modelos de IA.
*Janakiram MSV é analista, consultor e arquiteto da Janakiram & Associates.
(traduzido por Andressa Barbosa)