A empresa lançou nesta quinta-feira dois modelos de linguagem de grande porte (LLM), um tipo de modelo de IA, denominados Qwen-7B e Qwen-7B-Chat.
Cada modelo tem 7 bilhões de parâmetros, o que é frequentemente usado para medir a força desses sistemas. Essa é a primeira vez que uma grande empresa chinesa de tecnologia disponibiliza seu LLM em código aberto.
A Alibaba Cloud anunciou seu LLM chamado Tongyi Qianwen em abril, que vem com várias versões com diferentes números de parâmetros. A Alibaba disse que o Qwen-7B e o Qwen-7B-Chat são duas versões de tamanho pequeno do Tongyi Qianwen, cujo objetivo é ajudar pequenas e médias empresas a começar a usar IA.
O “código, os pesos do modelo e a documentação dos dois modelos serão de livre acesso para acadêmicos, pesquisadores e instituições comerciais em todo o mundo”, disse a empresa.
No entanto, para empresas com mais de 100 milhões de usuários ativos mensais, elas precisarão obter uma licença do Alibaba antes de usarem os dois modelos. Da mesma forma, o Llama 2, da Meta, também exige uma licença de usuários com mais de 700 milhões de usuários.
A China tem tentado alcançar os EUA no campo da IA. Pequim tem incentivado as empresas chinesas a desenvolverem rapidamente modelos de IA locais e “controláveis” que possam rivalizar com os desenvolvidos pelas empresas norte-americanas.
Além do Alibaba, gigantes da tecnologia como a Tencent Holdings e a Huawei têm desenvolvido seus próprios modelos de IA nos últimos meses.