広場
最新
注目
ニュース
プロフィール
ポスト
SunshineCollector
2026-05-20 16:59:03
フォロー
進化検索でGRPOを打ち負かし、19分でnanoGPTの35分の作業を完了、この自動化の錬金術はなかなかのものだ
原文表示
MeNews
2026-05-20 16:21:37
スタンフォードNLPチームが自動化AI研究の新進展を披露
スタンフォードNLPはICML 2026で、自動化された実行者を通じてLLMの事前訓練と後訓練を実行環境に変換し、実行フィードバックを利用して研究効率を向上させる方法を展示した。二つの方法:進化的探索は後訓練タスクでGRPO(69.4%対48.0%)より優れており、事前訓練タスクで見つかったレシピはnanoGPTよりも速い(19.7分対35.9分)、両者とも十回の探索内で完了;実行報酬に基づく強化学習はモード崩壊を起こしやすく、平均報酬は向上させたが上限は上げられなかった。この研究は、実行指向の自動化AI研究の方向性を示している。
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については
免責事項
をご覧ください。
報酬
いいね
コメント
リポスト
共有
コメント
コメントを追加
コメントを追加
コメント
コメントなし
人気の話題
もっと見る
#
TradfiTradingChallenge
246.28K 人気度
#
PlatinumCardCreatorExclusive
60.52K 人気度
#
IsraelStrikesIranBTCPlunges
48.62K 人気度
#
#DailyPolymarketHotspot
1.02M 人気度
#
GateSquarePizzaDay
1.72M 人気度
ピン留め
サイトマップ
進化検索でGRPOを打ち負かし、19分でnanoGPTの35分の作業を完了、この自動化の錬金術はなかなかのものだ