Стэнфорд NLP: большинство публичных данных для обучения интеллектуальных агентов по-прежнему сосредоточены на этапе постобучения

robot
Генерация тезисов в процессе
AIMPACT сообщение, 15 мая (UTC+8), команда NLP Стэнфордского университета в Twitter указала, что в настоящее время большинство публичных данных для обучения агентных систем по-прежнему в основном ориентированы на этап пост-обучения, особенно для моделей вроде Qwen (эти модели, возможно, уже обучены на большом объеме данных агентных систем). Эта команда считает, что для обучения хорошей открытой модели с нуля требуется значительно больше данных агентных систем, чем просто для пост-обучения с открытыми весами, что подчеркивает недостатки текущих данных для обучения агентных систем на этапе предварительного обучения. (Источник: InFoQ)
Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • 6
  • 8
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
DrawTheCandlestickChartIn
· 1ч назад
Это объясняет, почему у некоторых моделей-агентов способности скачут, фундамент не был заложен правильно.
Посмотреть ОригиналОтветить0
NeonMeltsIceCream
· 9ч назад
Открытая модель хочет догнать, стоимость данных агента на этапе предварительной тренировки слишком высока, небольшие команды не могут себе позволить.
Посмотреть ОригиналОтветить0
VineGeometry
· 9ч назад
Кажется, сейчас все занимаются дообучением, а барьер данных для предварительного обучения — это настоящая защита города.
Посмотреть ОригиналОтветить0
DexterRamen
· 9ч назад
Qwen был назван, ха-ха, но действительно в открытом исходном коде возможности агента наиболее выделяются.
Посмотреть ОригиналОтветить0
GateUser-9568ced5
· 9ч назад
Пробелы в предварительно обучающих данных очень важны, даже после дальней тренировки нельзя восполнить фундамент.
Посмотреть ОригиналОтветить0
Can'tSleepWithoutSigningThe
· 9ч назад
Мнение Стэнфорда интересно, разрыв в объеме данных интеллектуальных агентов больше, чем кажется.
Посмотреть ОригиналОтветить0
  • Закреплено