Маск: Grok V9 значно відрізняється від V8, тестова версія V9 вже показує кращі результати

robot
Генерація анотацій у процесі
AIMPACT повідомлення, 15 травня (UTC+8), Ілон Маск у платформі X повідомив, що його остання завершена тренування Grok V9 (1,5T параметрів) "показала дуже хороші результати", і цей результат ще не був включений до додаткового тренування даних Cursor. Поточна внутрішня розробка базової моделі — V9, з приблизно 1,5 трильйонами параметрів, значно покращена у порівнянні з V8 у питаннях очищення даних, методів тренування та масштабу моделі, а також оптимізована для архітектури Blackwell з метою підвищення ефективності використання обчислювальних ресурсів. Маск підкреслив, що у порівнянні, зовнішня версія v4.2 побудована на базі V8, з приблизно 0,5T параметрів, працює на архітектурі Hopper і має обмеження у якості та охопленні тренувальних даних. Відмінність у продуктивності між Grok V8 та V9 є значною, нове покоління моделей досягло революційного підвищення у загальних можливостях. (Джерело: ODAILY)
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • 8
  • 1
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
StardustUnderTheGlassDome
· 2год тому
Цікаво, чи покращилася частота галюцинацій у V9, великі моделі не обов'язково стають кращими з розміром.
Переглянути оригіналвідповісти на0
SudoSage
· 6год тому
Підвищення рівня з проривом — цей вираз, який виходить із вуст Маска, зазвичай означає, що справді є щось важливе
Переглянути оригіналвідповісти на0
YieldKaraoke
· 7год тому
Зовні все ще працює Hopper, всередині вже Blackwell, добре розуміє інформаційну різницю
Переглянути оригіналвідповісти на0
GateUser-53a6e1a8
· 7год тому
Обробка даних нарешті стала приділятися увагу, раніше якість відповідей Grok дійсно була непостійною.
Переглянути оригіналвідповісти на0
Don'tCallMeABagHolder.
· 7год тому
Оптимізація архітектури Blackwell є ключовою, підвищення ефективності використання обчислювальної потужності безпосередньо визначає можливість отримання прибутку
Переглянути оригіналвідповісти на0
LimeLeverageAlert
· 7год тому
Чекаючи інтеграцію Cursor, параметри V9 трохи вражають своїм масштабом
Переглянути оригіналвідповісти на0
BlackVelvetBluePeony
· 7год тому
Blackwell оптимізаційне пояснення: Старий Хуан і Маск стають все тісніше пов’язаними
Переглянути оригіналвідповісти на0
Post-RainCancellationAgent
· 7год тому
0.5Т до 1.5Т тричі більше параметрів, різниця дійсно велика
Переглянути оригіналвідповісти на0
  • Закріплено