Alibaba abre a próxima geração de flagship Qwen3.6-Max-Preview, com foco em programação de agentes inteligentes

robot
Geração do resumo em andamento
ME News Notícias, 20 de abril (UTC+8), de acordo com o monitoramento do Beating, a equipe do Aliyun Qianwen lançou o Qwen3.6-Max-Preview, posicionado como uma prévia da próxima geração do modelo principal, substituindo o atual Qwen3.6-Plus. Os usuários podem experimentar a conversa diretamente no Qwen Studio (chat.qwen.ai), e posteriormente acessar a API com o nome do modelo qwen3.6-max-preview através da Alibaba Cloud Balian; a interface é compatível com as normas de chat completions, responses da OpenAI e o protocolo da Anthropic. Esta versão é principalmente voltada para a programação de agentes inteligentes, permitindo que o modelo escreva código, execute, veja erros, chame ferramentas e complete tarefas de programação em múltiplos passos, como um programador. Em relação à versão anterior Qwen3.6-Plus, os aprimoramentos oficiais concentram-se na programação: SkillsBench +9.9, SciCode +10.8, NL2Repo +5.0, Terminal-Bench 2.0 +3.8 pontos; o conhecimento mundial e o formato de chamadas de ferramentas seguem melhorias de 2.3 a 5.3 pontos em três categorias distintas. A equipe afirma ter alcançado as maiores pontuações em seis benchmarks de programação, incluindo SWE-bench Pro, Terminal-Bench 2.0, SciCode, sendo que QwenClawBench e QwenWebBench parecem ser conjuntos de avaliação próprios da Qwen, devendo ser considerados separadamente das avaliações públicas. Do lado da API, também foi adicionado a opção preserve_thinking: ao ativar, as mensagens manterão o conteúdo de pensamento das rodadas anteriores. Modelos de raciocínio, por padrão, retornam apenas uma vez o "pensamento desta rodada"; em diálogos com múltiplos agentes, a ausência do raciocínio anterior no contexto pode fazer o modelo refazer ou esquecer o que já tentou, e essa opção ajuda a preencher essa lacuna. (Fonte: BlockBeats)
Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
Comentário
Adicionar um comentário
Adicionar um comentário
Sem comentários
  • Fixado