Маск Grok V9-Medium завершил дополнительную тренировку, внедрил Cursor данные, ориентированные на сложные сценарии программирования

robot
Генерация тезисов в процессе
По данным мониторинга Beating, Маск объявил, что базовая модель Grok V9-Medium с 1,5 трлн параметров под брендом xAI завершила обучение и ожидается, что в течение 2-3 недель она будет доступна для публики. В настоящее время модель переходит в этап контролируемой тонкой настройки, и в ближайшие дни начнется обучение с использованием усиленного обучения. Исследовательская команда в процессе дополнительного обучения включила большое количество кодовых данных Cursor, а также планирует продолжать добавлять больше образцов.

По сравнению с моделью v8-small, которая в настоящее время обеспечивает весь производственный трафик Grok, Grok V9-Medium с 1,5 трлн параметров значительно улучшит обработку сложных программных задач. Ранее Маск публично признал, что версия v8-small с 0,5 трлн параметров (то есть внешняя тестовая версия Grok 4.2) имела серьезные недостатки в качестве, полноте и пропорциях обучающих данных. Завершенная модель Grok V9-Medium не только увеличила масштаб параметров в три раза по сравнению с предыдущим поколением, но и была специально оптимизирована для архитектуры GPU Blackwell.
Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • 6
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
SugarMarketMaker
· 2ч назад
Размер параметров удваивается и снова удваивается, закон масштабирования все еще действует
Посмотреть ОригиналОтветить0
GateUser-318a7dc8
· 2ч назад
Способности к написанию Grok-кода должны догнать Claude, и пользователи Cursor будут в восторге
Посмотреть ОригиналОтветить0
ColdWalletFitnessCoach
· 3ч назад
Давайте проведем больше недель на этапе RL, не спешите выпускать полуфабрикат.
Посмотреть ОригиналОтветить0
GovernanceGremlin
· 3ч назад
Ждём только цену, не как у某家, которая стоит безумно дорого
Посмотреть ОригиналОтветить0
DaoSidekick
· 3ч назад
v8-small держится до сих пор, команда xAI infra может выдержать нагрузку
Посмотреть ОригиналОтветить0
PermissionedFury
· 3ч назад
После завершения контролируемой донастройки всё ещё требуется RL, процесс обучения довольно полный.
Посмотреть ОригиналОтветить0
  • Закреплено