Alibaba abre a próxima geração de flagship Qwen3.6-Max-Preview, com foco em programação de agentes inteligentes

robot
Geração de resumo em curso
ME News Notícias, 20 de abril (UTC+8), de acordo com a monitorização do Beating, a equipe do Ali Qianwen lançou o Qwen3.6-Max-Preview, posicionado como uma versão de pré-visualização inicial do próximo modelo de topo de gama, sucedendo o atual Qwen3.6-Plus. Os utilizadores podem experimentar a conversa diretamente no Qwen Studio (chat.qwen.ai), e posteriormente através do Alibaba Cloud Balian, com o nome do modelo qwen3.6-max-preview, abrir chamadas API; a interface é compatível com as normas de chat completions, responses da OpenAI e o protocolo da Anthropic.
Esta versão foca principalmente na programação de agentes inteligentes, permitindo que o modelo escreva código, execute, veja erros e chame ferramentas como um programador, completando tarefas de programação em múltiplos passos.
A melhoria oficial em relação ao antecessor Qwen3.6-Plus concentra-se na programação: SkillsBench +9.9, SciCode +10.8, NL2Repo +5.0, Terminal-Bench 2.0 +3.8 pontos; o conhecimento mundial e o formato de chamadas de ferramentas seguem uma melhoria de 2.3 a 5.3 pontos em três outras categorias.
A equipe afirma ter alcançado a pontuação mais alta em seis benchmarks de programação, incluindo SWE-bench Pro, Terminal-Bench 2.0, SciCode, sendo que QwenClawBench e QwenWebBench parecem ser conjuntos de avaliação próprios do Qwen, devendo ser considerados separadamente dos benchmarks públicos.
Do lado da API, também foi adicionado o parâmetro preserve_thinking: ao ativar, as mensagens irão reter o conteúdo de pensamento das primeiras rodadas.
O modelo de raciocínio, por padrão, retorna apenas uma vez o "pensamento desta rodada"; em diálogos com múltiplas rodadas, o contexto pode faltar os passos anteriores do raciocínio, e ao replanear, o modelo pode voltar a passos anteriores ou esquecer o que já tentou, e essa opção corrige essa lacuna.
(Fonte: BlockBeats)
Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixado