Sina lanza en código abierto VibeThinker-3B: el razonamiento se puede comprimir, el conocimiento factual no.

robot
Generación de resúmenes en curso
ME News mensaje, 28 de junio (UTC+8), Sina lanza VibeThinker-3B con solo 3B parámetros, que iguala en rendimiento a modelos como DeepSeek V3.2, de 200 a 333 veces más grandes, en puntos de referencia de matemáticas y programación como AIME26, supera a todos los modelos por debajo de 20B en LiveCodeBench, y resuelve 123/128 problemas en LeetCode Contest, por encima de GPT-5.2, Kimi K2.5, etc. Sin embargo, queda muy por detrás en el exigente benchmark de conocimiento GPQA-Diamond. El modelo se basa en Qwen2.5-Coder-3B de Alibaba, y ha sido entrenado posteriormente en múltiples etapas, incluyendo SFT, aprendizaje por refuerzo y autodestilación. El estudio propone la "hipótesis de compresión-cobertura de parámetros": el razonamiento lógico depende de unos pocos patrones compresibles, mientras que el amplio conocimiento mundial aún requiere grandes parámetros. El modelo ya es de código abierto. 🔗 Leer el artículo original:
Ver original
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios