Alibaba abre la vista previa de la próxima generación de buque insignia Qwen3.6-Max, centrada en la programación de agentes inteligentes

robot
Generación de resúmenes en curso
NOTICIAS ME, 20 de abril (UTC+8), según la monitorización de Dòngchá Beating, el equipo de Alibaba Qianwen lanzó Qwen3.6-Max-Preview, posicionado como la vista previa temprana del próximo modelo insignia de próxima generación, en reemplazo del actual Qwen3.6-Plus. Los usuarios pueden experimentar la interacción directamente en Qwen Studio (chat.qwen.ai), y posteriormente a través de Alibaba Cloud Bailian con el nombre de modelo qwen3.6-max-preview para llamadas API; la interfaz es compatible con las normas de completions y respuestas de chat de OpenAI, así como con el protocolo de Anthropic.
Esta versión está principalmente orientada a la programación de agentes (agentic coding), permitiendo que el modelo escriba código, lo ejecute, vea errores y llame a herramientas como un programador, completando tareas de programación en múltiples pasos.
La mejora oficial en comparación con la anterior Qwen3.6-Plus se centra en la programación: SkillsBench +9.9, SciCode +10.8, NL2Repo +5.0, Terminal-Bench 2.0 +3.8 puntos; el conocimiento del mundo y el formato de llamadas a herramientas siguen una mejora adicional de entre 2.3 y 5.3 puntos en otros tres aspectos.
La compañía afirma haber alcanzado la puntuación más alta en seis benchmarks de programación como SWE-bench Pro, Terminal-Bench 2.0, SciCode, entre otros, donde QwenClawBench y QwenWebBench parecen ser conjuntos de evaluación propios de Qianwen, que deben considerarse aparte de los benchmarks públicos.
En la API también se ha añadido la opción preserve_thinking: al activarla, los mensajes conservarán el contenido de pensamiento de las primeras rondas.
El modelo de razonamiento por defecto solo devuelve una vez el "pensamiento de esta ronda", y en diálogos con múltiples turnos, la falta de los pensamientos anteriores en el contexto puede hacer que el modelo vuelva a recorrer caminos o olvide qué ha probado, por lo que esta opción ayuda a cubrir esa brecha.
(Fuente: BlockBeats)
Ver original
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Fijado