Alibaba lanza la nueva generación de modelos base Qianwen 3.5, alcanzando la cima como el modelo de código abierto más potente del mundo

robot
Generación de resúmenes en curso

El 16 de febrero, día de la víspera de Año Nuevo, Alibaba lanzó la nueva generación de su gran modelo de código abierto, Qwen3.5-Plus, con un rendimiento comparable al Gemini 3 Pro, alcanzando la cima de los modelos de código abierto más potentes del mundo.

Se sabe que Qwen3.5 ha logrado una renovación completa en la arquitectura del modelo subyacente. La versión lanzada, Qwen3.5-Plus, cuenta con un total de 397 mil millones de parámetros, con solo 17 mil millones activados, superando en rendimiento al modelo Qwen3-Max de más de un billón de parámetros. Además, reduce en un 60% el uso de memoria de despliegue, aumenta significativamente la eficiencia de inferencia y puede elevar el rendimiento máximo de procesamiento hasta 19 veces. El precio de la API de Qwen3.5-Plus es de solo 0.8 yuanes por millón de tokens, lo que representa solo una 18ava parte del precio de Gemini 3 Pro.

A diferencia de las generaciones anteriores de modelos de lenguaje de Qwen, Qwen3.5 logra una transición generacional de modelos de texto puro a modelos multimodales nativos. Mientras que Qwen3 preentrenaba en tokens de texto puro, Qwen3.5 se entrena en tokens combinados de visión y texto, además de incorporar de manera significativa datos en chino, multilingües, STEM y razonamiento. Esto permite que el gran modelo “que abre los ojos” aprenda conocimientos del mundo más densos y lógica de razonamiento, logrando un rendimiento superior al de Qwen3-Max, con menos del 40% de los parámetros, en evaluaciones de referencia en razonamiento, programación y agentes inteligentes, entre otros.

El 15 de enero, la aplicación Qwen lanzó el primer agente de compras AI para consumo en el mundo. Durante el período del Año Nuevo, el agente de compras AI de Qwen ayudó a los usuarios a completar 120 millones de pedidos en 6 días, logrando por primera vez en el mundo la ejecución a gran escala de tareas del mundo real y la validación comercial. Con la significativa mejora de capacidades del agente, Qwen3.5 abrirá aún más el espacio para que la aplicación Qwen ayude en tareas laborales y cotidianas.

Desde su apertura en 2023, Alibaba ha lanzado más de 400 modelos Qwen, cubriendo todos los tamaños y modalidades. Las descargas globales de Qwen superan los 1,000 millones, con una cantidad mensual de descargas que supera la suma de DeepSeek, Meta, OpenAI, Zhipu, Kimi y MiniMax, entre otros. Más de 200,000 modelos derivados desarrollados por los desarrolladores están basados en Qwen, siendo el modelo de código abierto más reconocido a nivel mundial y el más amigable para los desarrolladores. Para satisfacer las necesidades de desarrolladores y empresas en diferentes países, los modelos Qwen continúan evolucionando: Qwen3.5 soporta 201 idiomas, ampliando el vocabulario de 150,000 a 250,000 palabras, lo que puede mejorar en un 60% la eficiencia de codificación en idiomas minoritarios.

Se informa que la aplicación Qwen y la versión para PC ya han integrado inmediatamente el modelo Qwen3.5-Plus. Los desarrolladores pueden descargar el nuevo modelo en la comunidad Mofa y HuggingFace, o acceder directamente a los servicios API a través de Alibaba Cloud Bailing. Alibaba continuará lanzando modelos de la serie Qwen3.5 en diferentes tamaños y funciones. Muy pronto también se lanzará el modelo insignia Qwen3.5-Max, con mayor rendimiento.

Ver original
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Anclado