AIMPACT メッセージ、5 月 17 日（UTC+8）、この解釈性論文はツール使用代理に焦点を当てており、隠れた状態を検出することでモデルが呼び出すべきツールを認識できることが多いが、実際の呼び出しは失敗し、ミスマッチ率は26％〜54％に達している。問題は完全に認知から行動への移行段階に集中しており、認知そのものではない。内部検出の方向性はデコード可能だが、後期層の最後のトークンメカニズムにより信号が回転し、生成された行動とほぼ直交している。研究は介入の効果を予測することを目的としており、一般的な帰属として提示や訓練不足が後期層の幾何学的構造を見落とす可能性を指摘し、これがツール使用のヒントA/Bテストにおける性能上限の合理的な説明を提供している。（出典：AiHot）

原文表示

このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております（表明・保証をするものではありません）。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。

7 いいね

報酬
7
6
リポスト
共有

コメントを追加

GateUser-cf218ace

· 5時間前

後層トークンの幾何学的回転という発見は非常に重要です。以前は皆、プロンプトエンジニアリングを調整し続けていましたが、実は根本的な原因は表現空間の方向のずれにあったのです。

原文表示返信0

FloatingTeacup

· 5時間前

認知から行動への変換のボトルネック、このフレームワークは多くのAI安全問題に適用できる

原文表示返信0

QuietRugAlarm

· 6時間前

正交という言葉の使い方が巧妙で、信号と行動はほぼ垂直であり、どんなに強い認知も打ち破ることができない

原文表示返信0

FarmingNoSleep

· 6時間前

幾何構造 > ヒントエンジニアリング、この結論はエージェントを作る人にとって非常に重要です

原文表示返信0

StardustUnderTheGlassDome

· 6時間前

考えた結果、これがなぜ時々同じツールでも別の言い方に変えると呼び出しに成功し、角度を変えると成功しなくなるのかを説明している

原文表示返信0

YieldBento

· 6時間前

内部信号はデコード可能だが後段層は直交している、この直交性の設計はバグなのかそれとも機能なのか

原文表示返信0

人気の話題
もっと見る
#
ShareYourUSStocksWinNvidia
23.98M 人気度
#
WinGoldBarsWithGrowthPoints
1.28M 人気度
#
IsraelStrikesIranBTCPlunges
52.35K 人気度
#
NvidiaSurges6PercentToRecordHigh
2.88M 人気度
#
AnthropicFilesConfidentialIPO
485.32K 人気度

ピン留め

サイトマップ

ツール使用における代理認知と行動の乖離メカニズム研究

人気の話題

ShareYourUSStocksWinNvidia

WinGoldBarsWithGrowthPoints

IsraelStrikesIranBTCPlunges

NvidiaSurges6PercentToRecordHigh

AnthropicFilesConfidentialIPO

ピン留め