Сіна відкрила вихідний код VibeThinker-3B: міркування можна стиснути, а фактичні знання - ні.

robot
Генерація анотацій у процесі
НОВИНИ ME News, 28 червня (UTC+8), Sina випустила VibeThinker-3B лише з 3B параметрів, який досяг рівня DeepSeek V3.2 та інших моделей, що в 200–333 рази більші, на еталонних тестах математики та програмування, таких як AIME26, перевершив усі моделі до 20B на LiveCodeBench, вирішив 123/128 завдань LeetCode, обійшовши GPT-5.2, Kimi K2.5 та ін. Однак значно відстає на знаннєвоємному GPQA-Diamond. Модель базується на Qwen2.5-Coder-3B від Alibaba, пройшла багатоетапне донавчання: SFT, RL, самодистиляцію тощо. Дослідження пропонує «гіпотезу стиснення-покриття параметрів»: логічне міркування покладається на невелику кількість стислих шаблонів, тоді як широкі знання про світ все ще потребують великої кількості параметрів. Модель є відкритою. 🔗 Читати далі:
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріплено