📢 Gate 廣場 TradFi 交易分享挑戰上線!
晒单瓜分 $30,000 獎池,新人首帖 100% 中獎!
📌 參與方式:
帶 #TradFi交易分享挑战 發帖,滿足以下任一即可:
🔹 帶今日指定 TradFi 幣種標籤發帖交流。
🔹 完成單筆大於 $10U 的 TradFi CFD 交易並掛載交易卡片。
🏷️ 今日指定標籤:USDJPY、AUDUSD、US30、TSLA、JPN225
🎁 寵粉福利:
1️⃣ 卡片分享獎: 抽 50 人,每人送 $100 仓位體驗券!
2️⃣ 發帖榜單獎: 衝排行榜,贏 WCTC 限定 T 恤!
3️⃣ 新粉見面禮: 新人首次發帖,100% 領 $10 體驗券!
詳情:https://www.gate.com/announcements/article/51221
這篇由史丹佛和哈佛共同撰寫的論文解釋了為何大多數“具備代理能力的人工智慧(agentic AI)”系統在演示中令人印象深刻,但在實際應用中卻完全崩潰。
它被稱為“代理人工智慧的適應(Adaptation of Agentic AI)”,也是我今年讀過的最重要的論文。
目前,大家都熱衷於建立自主代理。我们赋予它们工具、記憶和目標,期望它們能完成我們的工作。
但在實際部署到現實世界時,它們會出現幻覺式的工具調用,長期規劃失敗,甚至崩潰。
原因如下:
我們試圖將所有學習都塞進AI的大腦中。
當開發者試圖修復一個出錯的代理時,通常只是微調主模型以產生更好的最終答案。
研究人員發現了這種方法的致命缺陷。
如果只用最終答案的正確性來獎勵AI,它就會變得懶惰。
它實際上學會停止使用工具,試圖猜答案而不是做實際的工作。它會忽略計算器,試圖在腦中做數學。
為了解決這個問題,研究人員提出了一個新的四部分框架,來指導代理的真正學習方式。
而最大的啟示徹底顛覆了目前的思維模式。
與其不斷重新訓練那個龐大且昂貴的“腦袋”,最可靠的系統採取相反的方法。
它們會凍結“腦袋”,並調整工具。
他們稱之為“代理監督的工具適應(Agent-Supervised Tool Adaptation)”。