Alibaba lança modelo de IA de código aberto para enfrentar Llama 2 da Meta

Reuters

3 de agosto de 2023

Engenheiros de machine learning Algumas profissões surgiram do zero, baseadas em cargos tradicionais em tecnologia que temos hoje. Para que os computadores consigam operar com base em dados e algoritmos, os engenheiros de machine learning (aprendizado de máquina), serão cruciais. Responsáveis pela programação, esses profissionais criam e treinam os modelos computacionais para execução de tarefas específicas.

A Alibaba Cloud anunciou seu LLM chamado Tongyi Qianwen em abril

A unidade de computação em nuvem da gigante chinesa de tecnologia Alibaba Group lançou dois modelos de inteligência artificial (IA) de código aberto nesta quinta-feira (3), em uma tentativa de enfrentar a Meta Platform.

A empresa lançou nesta quinta-feira dois modelos de linguagem de grande porte (LLM), um tipo de modelo de IA, denominados Qwen-7B e Qwen-7B-Chat.

Cada modelo tem 7 bilhões de parâmetros, o que é frequentemente usado para medir a força desses sistemas. Essa é a primeira vez que uma grande empresa chinesa de tecnologia disponibiliza seu LLM em código aberto.

Isso também ocorre depois que a Meta revelou um modelo semelhante de código aberto chamado Llama 2 no mês passado. Alguns analistas disseram que os modelos de código aberto podem reduzir o domínio atual do mercado desfrutado pela OpenAI, desenvolvedora do ChatGPT, e pelo Google, cujos modelos de IA cobram taxas caras dos usuários.

A Alibaba Cloud anunciou seu LLM chamado Tongyi Qianwen em abril, que vem com várias versões com diferentes números de parâmetros. A Alibaba disse que o Qwen-7B e o Qwen-7B-Chat são duas versões de tamanho pequeno do Tongyi Qianwen, cujo objetivo é ajudar pequenas e médias empresas a começar a usar IA.

O “código, os pesos do modelo e a documentação dos dois modelos serão de livre acesso para acadêmicos, pesquisadores e instituições comerciais em todo o mundo”, disse a empresa.

No entanto, para empresas com mais de 100 milhões de usuários ativos mensais, elas precisarão obter uma licença do Alibaba antes de usarem os dois modelos. Da mesma forma, o Llama 2, da Meta, também exige uma licença de usuários com mais de 700 milhões de usuários.

O Alibaba disse que o Tongyi Qianwen tem versões com um número maior de parâmetros que não foram abertos, mas não informou quantos parâmetros seu maior modelo contém. A maior versão do Llama 2 apresenta 70 bilhões de parâmetros.

A China tem tentado alcançar os EUA no campo da IA. Pequim tem incentivado as empresas chinesas a desenvolverem rapidamente modelos de IA locais e “controláveis” que possam rivalizar com os desenvolvidos pelas empresas norte-americanas.

Além do Alibaba, gigantes da tecnologia como a Tencent Holdings e a Huawei têm desenvolvido seus próprios modelos de IA nos últimos meses.

Ler a seguir: Pedidos de auxílio-desemprego nos EUA sobem moderadamente »

Alibabaempresasinteligência artificialmercadosmeta