AIMPACT メッセージ、5 月 15 日（UTC+8）、スタンフォードNLPチームはTwitter上で指摘した。現在、公開されているほとんどのエージェント（agentic）訓練データは依然として後訓練（post-training）段階を主に対象としており、特にQwenなどのモデル（これらのモデルはすでに大量のエージェントデータで訓練されている可能性がある）に使用されている。チームは、良いオープンソースモデルをゼロから訓練するには、必要なエージェントデータ量は単にオープンな重みを用いた後訓練だけでははるかに不足していると考えており、これが現在のエージェント訓練データの事前訓練段階での不足を浮き彫りにしている。（出典：InFoQ）

原文表示

このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております（表明・保証をするものではありません）。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。

8 いいね

報酬
8
12
8
共有

コメントを追加

SushiAndSlugs

· 8時間前

Qwenこの一波はラッキー勝ちと言えるか？

原文表示返信0

FlamingoFacingJudgment

· 8時間前

オープンソースモデルはクローズドに追いつきたい、データの壁は計算能力よりも破りにくい

原文表示返信0

ColdLightNftCabinet

· 12時間前

オープンソースコミュニティは、事前学習データのクラウドファンディング方法について考える必要がある

原文表示返信0

GateUser-a365d15f

· 12時間前

またデータが権力であるという古い物語に戻ったようだ

原文表示返信0

GateUser-46033407

· 12時間前

ゼロから訓練するのに必要なデータ量、聞くだけで絶望的だ

原文表示返信0

PerpNightshift

· 12時間前

この研究はクローズドソース派に刃を突きつけた。

原文表示返信0

GateUser-46c777d0

· 12時間前

スタンフォードのこの観察は的確で、エージェントの能力は確かに後から訓練で積み上げられるものだ。

原文表示返信0

GlassDomeRoaming

· 12時間前

事后训练的优化空间总有极限，预训练的短板迟早会暴露

原文表示返信0

GateUser-e84f640c

· 12時間前

この結論は中小チームにとってかなり打撃であり、データの門戸がますます高くなっている。

原文表示返信0

ExitLiquidityStan

· 12時間前

希望有人能开源一些高质量的预训练代理数据

原文表示返信0

人気の話題
もっと見る
#
TradfiTradingChallenge
201.74K 人気度
#
30YearTreasuryYieldBreaks5%
368.4K 人気度
#
IsraelStrikesIranBTCPlunges
48.29K 人気度
#
#DailyPolymarketHotspot
1M 人気度
#
RWAMarketCapExceeds65Billion
8.76M 人気度

ピン留め

サイトマップ

スタンフォードNLP：ほとんどの公開されたエージェントのトレーニングデータは依然として後期トレーニング段階に集中している

人気の話題

TradfiTradingChallenge

30YearTreasuryYieldBreaks5%

IsraelStrikesIranBTCPlunges

#DailyPolymarketHotspot

RWAMarketCapExceeds65Billion

ピン留め