Маск: Разница между Grok V9 и V8 огромна, версия V9 для обучения показывает лучшие результаты

robot
Генерация тезисов в процессе

AIMPACT сообщение, 15 мая (UTC+8), Маск в платформе X заявил, что его недавно завершённый тренинг Grok V9 (1.5T параметров) “показал очень хорошие результаты”, и этот результат ещё не включён в дополнительную тренировочную часть данных Cursor. В настоящее время разрабатываемая внутренняя версия базовой модели — V9, с примерно 1.5 трлн параметров, значительно превосходит V8 по очистке данных, методам обучения и масштабу модели, а также оптимизирована под архитектуру Blackwell для повышения эффективности использования вычислительных ресурсов. Маск подчеркнул, что по сравнению с этим, внешняя версия v4.2 основана на базовой модели V8, с примерно 0.5T параметров, работает на архитектуре Hopper, и всё ещё имеет ограничения по качеству и охвату обучающих данных. Производительность Grok V8 и V9 значительно различается, новая модель достигла скачкообразного улучшения в общих возможностях. (Источник: ODAILY)

Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Закреплено