Alibaba abre a próxima geração de flagship Qwen3.6-Max-Preview, com foco em programação de agentes inteligentes

robot
Geração do resumo em andamento
ME News Notícias, 20 de abril (UTC+8), de acordo com o monitoramento do Beating, a equipe do Aliyun Qianwen lançou o Qwen3.6-Max-Preview, posicionado como uma prévia da próxima geração de modelos principais, substituindo o atual Qwen3.6-Plus. Os usuários podem experimentar a conversa diretamente no Qwen Studio (chat.qwen.ai), e posteriormente acessar a API com o nome do modelo qwen3.6-max-preview através da Alibaba Cloud Balian; a interface é compatível com as normas de chat completions, responses da OpenAI e o protocolo da Anthropic. Esta versão é principalmente voltada para a programação de agentes inteligentes, permitindo que o modelo escreva código, execute, veja erros e chame ferramentas como um programador, completando tarefas de programação em múltiplos passos. Em relação à geração anterior Qwen3.6-Plus, os aprimoramentos principais focam na programação: SkillsBench +9.9, SciCode +10.8, NL2Repo +5.0, Terminal-Bench 2.0 +3.8 pontos; o conhecimento mundial e o formato de chamadas de ferramentas seguem melhorias de 2.3 a 5.3 pontos em três categorias distintas. A equipe afirma ter alcançado as maiores pontuações em seis benchmarks de programação, incluindo SWE-bench Pro, Terminal-Bench 2.0, SciCode, entre outros, sendo que QwenClawBench e QwenWebBench parecem ser conjuntos de avaliação próprios da Qwen, devendo ser considerados separadamente dos benchmarks públicos. Na API, também foi adicionado o parâmetro preserve_thinking: ao ativar, as mensagens manterão o conteúdo de pensamento das rodadas anteriores. Modelos de raciocínio normalmente retornam apenas uma vez o "pensamento desta rodada", e em diálogos com múltiplos agentes, a falta do raciocínio anterior no contexto pode fazer o modelo refazer o caminho ou esquecer o que já tentou, e essa opção corrige essa lacuna. (Fonte: BlockBeats)
Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
Comentário
Adicionar um comentário
Adicionar um comentário
Sem comentários
  • Fixado