Венсінь 5.1 офіційно запущений: параметри зменшені до третини від 5.0, витрати на попереднє навчання становлять лише 6% від витрат конкурентів

Згідно з моніторингом Beating, офіційно запущена велика модель Baidu Wenxin 5.1, користувачі можуть випробувати її на офіційному сайті Wenxin Yiyan, а підприємства та розробники — через платформу Qianfan для виклику API. Wenxin 5.1 побудована на основі Wenxin 5.0, випущеної у січні цього року, основною перевагою є значне зменшення розміру моделі та витрат на тренування: загальна кількість параметрів зменшена до приблизно третини від Wenxin 5.0, активних параметрів — приблизно половина, витрати на попереднє тренування — лише 6% від моделей такого ж масштабу.
Зменшення витрат досягнуто завдяки гнучкій тренувальній платформі Once-for-All, запропонованій Baidu. Традиційно для моделей різного масштабу потрібно окремо проводити попереднє тренування, тоді як Wenxin 5.0 виконує лише одне попереднє тренування, що дозволяє за допомогою динамічного вибірки одночасно оптимізувати багато підмоделей різного розміру. Wenxin 5.1 — це найкраща структура, витягнута з цієї матриці підмоделей, яка безпосередньо успадковує знання від 5.0, економлячи обчислювальні ресурси на тренування з нуля.
Раніше, 30 квітня, версія Wenxin 5.1 Preview вже зайняла перше місце в внутрішньому рейтингу LMArena з 1476 балами. Офіційна версія ще більше покращила результати у бенчмарках: у математичному конкурсі AIME26 (з використанням інструментів) отримала 99.6 балів, поступаючись лише Gemini-3.1 Pro; здатність агента перевищує DeepSeek-V4-Pro; у рейтингу пошуку Arena з результатом 1223 балів посідає четверте місце у світі та перше в країні.

Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріпити