Alibaba Cloud lanza el modelo Qwen3-Max con mil millones de parámetros, cuyo rendimiento se sitúa entre los mejores del mundo.

robot
Generación de resúmenes en curso

【链文】24 de septiembre, noticias: Alibaba Cloud lanzó el modelo de gran tamaño Qwen3-Max, el más grande hasta la fecha, con más de 1 billón de parámetros y 36 billones de tokens para preentrenamiento. La versión preliminar de Qwen3-Max-Instruct ocupa el tercer lugar en la tabla de clasificación de textos LMArena a nivel mundial, mientras que la versión oficial mejora el rendimiento en generación de código y tareas de agentes, con una puntuación de 69.6 en SWE-Bench Verified y 74.8 en Tau2-Bench. La versión mejorada para inferencia Qwen3-Max-Thinking obtuvo la puntuación máxima en las pruebas de razonamiento matemático AIME 25 y HMMT. La API ya está abierta y es compatible con el método de llamada de OpenAI.

Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • 8
  • Republicar
  • Compartir
Comentar
0/400
FunGibleTomvip
· hace3h
Aunque sea seis nueve, ¿se puede superar a hf?
Ver originalesResponder0
NightAirdroppervip
· hace3h
Parece estar bien. ¿Se han corregido los errores de la versión anterior?
Ver originalesResponder0
  • Anclado
Opera con criptomonedas en cualquier momento y lugar
qrCode
Escanee para descargar la aplicación Gate
Comunidad
Español
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)