Alibaba abre a próxima geração de flagship Qwen3.6-Max-Preview, com foco em programação de agentes inteligentes

robot
Geração de resumo em curso
ME News Notícias, 20 de abril (UTC+8), de acordo com a monitorização do Beating, a equipe do Aliyun Qianwen lançou o Qwen3.6-Max-Preview, posicionado como uma versão de pré-visualização inicial do próximo modelo de topo de gama, sucedendo o atual Qwen3.6-Plus. Os utilizadores podem experimentar a conversa diretamente no Qwen Studio (chat.qwen.ai), e posteriormente, através do Alibaba Cloud Balian, a API será disponibilizada com o nome de modelo qwen3.6-max-preview; a interface é compatível com as normas de completions de chat e respostas da OpenAI, bem como com o protocolo da Anthropic. Esta versão foca principalmente na programação de agentes inteligentes, permitindo que o modelo escreva código, execute, veja erros e chame ferramentas como um programador, completando tarefas de programação em múltiplos passos. Em relação à versão anterior Qwen3.6-Plus, as melhorias oficiais concentram-se na programação: SkillsBench +9,9, SciCode +10,8, NL2Repo +5,0, Terminal-Bench 2.0 +3,8 pontos; o conhecimento mundial e o formato de chamadas de ferramentas seguem com melhorias de 2,3 a 5,3 pontos em três categorias distintas. A equipe afirma ter alcançado as pontuações mais altas em seis benchmarks de programação, incluindo SWE-bench Pro, Terminal-Bench 2.0, SciCode, sendo que QwenClawBench e QwenWebBench parecem ser conjuntos de avaliação próprios da Qwen, devendo ser considerados separadamente dos benchmarks públicos. Do lado da API, também foi adicionado a opção preserve_thinking: ao ativar, as mensagens irão reter o conteúdo de reflexão das primeiras rodadas. Modelos de raciocínio, por padrão, retornam apenas uma vez o "pensamento desta rodada"; em diálogos com múltiplos agentes, a falta do raciocínio das etapas anteriores no contexto pode fazer o modelo refazer ou esquecer o que já tentou, e essa opção ajuda a preencher essa lacuna. (Fonte: BlockBeats)
Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixado