AIMPACT сообщение, 15 мая (UTC+8), команда NLP Стэнфордского университета в Twitter указала, что в настоящее время большинство публичных данных для обучения агентных систем по-прежнему в основном ориентированы на этап пост-обучения, особенно для моделей вроде Qwen (эти модели, возможно, уже обучены на большом объеме данных агентных систем). Эта команда считает, что для обучения хорошей открытой модели с нуля требуется значительно больше данных агентных систем, чем просто для пост-обучения с открытыми весами, что подчеркивает недостатки текущих данных для обучения агентных систем на этапе предварительного обучения. (Источник: InFoQ)

Посмотреть Оригинал

На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .

7 Лайков

Награда
7
6
8
Поделиться

комментарий

Добавить комментарий

DrawTheCandlestickChartIn

· 1ч назад

Это объясняет, почему у некоторых моделей-агентов способности скачут, фундамент не был заложен правильно.

Посмотреть ОригиналОтветить0

NeonMeltsIceCream

· 9ч назад

Открытая модель хочет догнать, стоимость данных агента на этапе предварительной тренировки слишком высока, небольшие команды не могут себе позволить.

Посмотреть ОригиналОтветить0

VineGeometry

· 9ч назад

Кажется, сейчас все занимаются дообучением, а барьер данных для предварительного обучения — это настоящая защита города.

Посмотреть ОригиналОтветить0

DexterRamen

· 9ч назад

Qwen был назван, ха-ха, но действительно в открытом исходном коде возможности агента наиболее выделяются.

Посмотреть ОригиналОтветить0

GateUser-9568ced5

· 9ч назад

Пробелы в предварительно обучающих данных очень важны, даже после дальней тренировки нельзя восполнить фундамент.

Посмотреть ОригиналОтветить0

Can'tSleepWithoutSigningThe

· 9ч назад

Мнение Стэнфорда интересно, разрыв в объеме данных интеллектуальных агентов больше, чем кажется.

Посмотреть ОригиналОтветить0

Популярные темы
Подробнее
#
TradfiTradingChallenge
200.69K Популярность
#
30YearTreasuryYieldBreaks5%
366.61K Популярность
#
IsraelStrikesIranBTCPlunges
48.28K Популярность
#
#DailyPolymarketHotspot
1M Популярность
#
RWAMarketCapExceeds65Billion
8.76M Популярность

Закреплено

Карта сайта

Стэнфорд NLP: большинство публичных данных для обучения интеллектуальных агентов по-прежнему сосредоточены на этапе постобучения

Популярные темы

TradfiTradingChallenge

30YearTreasuryYieldBreaks5%

IsraelStrikesIranBTCPlunges

#DailyPolymarketHotspot

RWAMarketCapExceeds65Billion

Закреплено