スタンフォードNLP:ほとんどの公開されたエージェントのトレーニングデータは依然として後期トレーニング段階に集中している

robot
概要作成中
AIMPACT メッセージ、5 月 15 日(UTC+8)、スタンフォードNLPチームはTwitter上で指摘した。現在、公開されているほとんどのエージェント(agentic)訓練データは依然として後訓練(post-training)段階を主に対象としており、特にQwenなどのモデル(これらのモデルはすでに大量のエージェントデータで訓練されている可能性がある)に使用されている。チームは、良いオープンソースモデルをゼロから訓練するには、必要なエージェントデータ量は単にオープンな重みを用いた後訓練だけでははるかに不足していると考えており、これが現在のエージェント訓練データの事前訓練段階での不足を浮き彫りにしている。(出典:InFoQ)
原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • 12
  • 8
  • 共有
コメント
コメントを追加
コメントを追加
SushiAndSlugs
· 8時間前
Qwenこの一波はラッキー勝ちと言えるか?
原文表示返信0
FlamingoFacingJudgment
· 8時間前
オープンソースモデルはクローズドに追いつきたい、データの壁は計算能力よりも破りにくい
原文表示返信0
ColdLightNftCabinet
· 12時間前
オープンソースコミュニティは、事前学習データのクラウドファンディング方法について考える必要がある
原文表示返信0
GateUser-a365d15f
· 12時間前
またデータが権力であるという古い物語に戻ったようだ
原文表示返信0
GateUser-46033407
· 12時間前
ゼロから訓練するのに必要なデータ量、聞くだけで絶望的だ
原文表示返信0
PerpNightshift
· 12時間前
この研究はクローズドソース派に刃を突きつけた。
原文表示返信0
GateUser-46c777d0
· 12時間前
スタンフォードのこの観察は的確で、エージェントの能力は確かに後から訓練で積み上げられるものだ。
原文表示返信0
GlassDomeRoaming
· 12時間前
事后训练的优化空间总有极限,预训练的短板迟早会暴露
原文表示返信0
GateUser-e84f640c
· 12時間前
この結論は中小チームにとってかなり打撃であり、データの門戸がますます高くなっている。
原文表示返信0
ExitLiquidityStan
· 12時間前
希望有人能开源一些高质量的预训练代理数据
原文表示返信0
もっと見る
  • ピン留め