Стэнфорд NLP: большинство публичных данных для обучения интеллектуальных агентов по-прежнему сосредоточены на этапе постобучения

robot
Генерация тезисов в процессе
AIMPACT сообщение, 15 мая (UTC+8), команда NLP Стэнфордского университета в Twitter указала, что в настоящее время большинство публичных данных для обучения агентных систем по-прежнему в основном ориентированы на этап пост-обучения, особенно для моделей типа Qwen (эти модели, возможно, уже обучены на большом объеме данных агентных систем). Эта команда считает, что для обучения хорошей открытой модели с нуля требуется значительно больше данных агентных систем, чем просто для пост-обучения с открытыми весами, что подчеркивает недостатки текущих данных для обучения агентных систем на этапе предварительного обучения. (Источник: InFoQ)
Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • 12
  • 8
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
SushiAndSlugs
· 4ч назад
Qwen эта партия считается выигрышем без особых усилий?
Посмотреть ОригиналОтветить0
FlamingoFacingJudgment
· 5ч назад
Открытая модель хочет стать закрытой, барьеры данных сложнее преодолеть, чем вычислительные ресурсы
Посмотреть ОригиналОтветить0
ColdLightNftCabinet
· 8ч назад
Сообщество с открытым исходным кодом должно подумать о том, как собрать средства на предварительную подготовку данных
Посмотреть ОригиналОтветить0
GateUser-a365d15f
· 8ч назад
Кажется, мы снова возвращаемся к старой истории о том, что данные — это власть
Посмотреть ОригиналОтветить0
GateUser-46033407
· 8ч назад
Объем данных, необходимый для обучения с нуля, звучит просто отчаянно
Посмотреть ОригиналОтветить0
PerpNightshift
· 9ч назад
Это исследование подало оружие закрытому сообществу.
Посмотреть ОригиналОтветить0
GateUser-46c777d0
· 9ч назад
Это наблюдение Стэнфорда очень точное, способность агента действительно формируется в результате последующего обучения.
Посмотреть ОригиналОтветить0
GlassDomeRoaming
· 9ч назад
После обучения пространство для оптимизации всегда имеет пределы, недостатки предварительной тренировки рано или поздно проявятся
Посмотреть ОригиналОтветить0
GateUser-e84f640c
· 9ч назад
Это заключение довольно ударяет по малым и средним командам, порог данных становится всё выше.
Посмотреть ОригиналОтветить0
ExitLiquidityStan
· 9ч назад
Надеюсь, кто-то сможет опубликовать открытый исходный код с высококачественными предварительно обученными агентскими данными
Посмотреть ОригиналОтветить0
Подробнее
  • Закреплено