Sina открыла исходный код VibeThinker-3B: рассуждения сжимаемы, фактические знания — нет.

robot
Генерация тезисов в процессе
ME News сообщает, 28 июня (UTC+8), Sina выпустила VibeThinker-3B всего с 3B параметров. На эталонных тестах по математике и программированию, таких как AIME26, он соответствует моделям DeepSeek V3.2 и другим, в 200–333 раза большим. LiveCodeBench превосходит все модели до 20B. На LeetCode конкурсе решено 123/128 задач, что превосходит GPT-5.2, Kimi K2.5 и др. Однако на знаниеёмком GPQA-Diamond значительно отстаёт. Модель основана на Alibaba Qwen2.5-Coder-3B, прошла многоэтапное пост-обучение: SFT, обучение с подкреплением, самодистилляцию и др. Исследование выдвигает «гипотезу сжатия параметров — покрытия»: логические рассуждения зависят от небольшого числа сжимаемых шаблонов, а обширные мировые знания по-прежнему требуют больших параметров. Модель открыта. 🔗 Читать оригинал:
Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Закреплено