Это можно считать холодным душем для сообщества открытого исходного кода: открытие весов ≠ открытие возможностей, а разрыв в данных становится еще труднее преодолеть.

Посмотреть Оригинал
MeNews
Стэнфорд NLP: большинство публичных данных для обучения интеллектуальных агентов по-прежнему сосредоточены на этапе постобучения
Команда NLP Стэнфордского университета в Twitter заявила, что текущие открытые данные для обучения агентов в основном используются на этапе дообучения, особенно для моделей вроде Qwen. Эти модели, возможно, уже были обучены на большом объеме данных агентов. Они считают, что объем данных агентов, необходимый для обучения отличных открытых моделей с нуля, значительно превышает масштаб дообучения только на открытых весах, что подчеркивает недостаточность данных агентов на этапе предварительного обучения. Источник: InFoQ
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Закреплено