Alibaba lança a nova geração de modelos baseados em Prompt, Qianwen 3.5, conquistando o topo do ranking dos maiores modelos de código aberto do mundo

robot
Geração de resumo em curso

No dia 16 de fevereiro, Dia da Lua Nova, a Alibaba lançou open source a nova geração do grande modelo Qwen3.5-Plus, cujo desempenho rivaliza com o Gemini 3 Pro, conquistando o topo do ranking dos modelos open source mais poderosos do mundo.

Segundo informações, o Qwen3.5 realizou uma renovação completa na arquitetura do modelo de base. A versão Qwen3.5-Plus lançada possui um total de 397 bilhões de parâmetros, com apenas 17 bilhões ativados, superando o desempenho do modelo Qwen3-Max de trilhões de parâmetros. O uso de memória de GPU na implantação foi reduzido em 60%, a eficiência de inferência foi significativamente aumentada, podendo alcançar até 19 vezes a taxa de processamento. O preço da API do Qwen3.5-Plus caiu para 0,8 yuan por milhão de tokens, sendo apenas 1/18 do preço do Gemini 3 Pro.

Diferentemente das gerações anteriores do grande modelo de linguagem Qwen, o Qwen3.5 realizou uma transição de um modelo de texto puro para um modelo multimodal nativo. O pré-treinamento do Qwen3 foi realizado com tokens de texto puro, enquanto o Qwen3.5 foi treinado com tokens combinados de visão e texto, além de incluir significativamente mais dados em chinês, múltiplas línguas, STEM e raciocínio, permitindo que o grande modelo “que abre os olhos” aprenda conhecimentos mais densos do mundo e lógica de raciocínio. Com menos de 40% dos parâmetros, alcançou desempenho de ponta no modelo base Qwen3-Max de trilhões de tokens, demonstrando excelente desempenho em avaliações abrangentes de raciocínio, programação e agentes inteligentes.

Em 15 de janeiro, o aplicativo Qwen lançou o primeiro agente de compras AI de consumo do mundo. Durante o período do Ano Novo Chinês, o agente de compras AI do Qwen ajudou os usuários a completar 120 milhões de pedidos em 6 dias, realizando pela primeira vez no mundo uma execução em larga escala de tarefas do mundo real e validação comercial. Com capacidades significativamente aprimoradas, o Qwen3.5 abrirá ainda mais possibilidades para o aplicativo Qwen ajudar as pessoas em trabalho e vida cotidiana.

Desde seu lançamento open source em 2023, a Alibaba já disponibilizou mais de 400 modelos Qwen, abrangendo todos os tamanhos e modalidades. O número de downloads globais do Qwen ultrapassou 1 bilhão, sendo que o volume de downloads mensais é de 2 a 8 vezes maior do que o total de DeepSeek, Meta, OpenAI, Zhipu, Kimi, MiniMax e outros. Mais de 200 mil modelos derivados foram desenvolvidos por desenvolvedores com base no Qwen, consolidando-se como o maior modelo open source do mundo e o mais amigável para desenvolvedores. Para atender às necessidades de desenvolvedores e empresas de diferentes países, o grande modelo Qwen continua evoluindo: o Qwen3.5 suporta agora 201 línguas, expandindo o vocabulário de 150 mil para 250 mil palavras, podendo aumentar a eficiência de codificação de línguas minoritárias em até 60%.

Sabe-se que o aplicativo Qwen e a versão para PC já incorporaram imediatamente o modelo Qwen3.5-Plus. Desenvolvedores podem baixar o novo modelo na comunidade Mota e no HuggingFace, ou obter o serviço API diretamente através do Alibaba Cloud Bailing. A Alibaba também continuará a open source modelos da série Qwen3.5 de diferentes tamanhos e funcionalidades. Em breve, será lançado o modelo flagship Qwen3.5-Max, com desempenho ainda mais potente.

Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixar