廣場
最新
熱門
新聞
我的主頁
發布
Opus 4.7低思考度壓過Sonnet 4.6最大值,Anthropic發布首份智能體操控調優指南
ME News
2026-06-27 08:08:22
關注
摘要生成中
AIMPACT 消息,5 月 20 日(UTC+8),據 動察 Beating 監測,Anthropic 發布首份官方開發指南,深入披露了 Claude 4.6 與 Opus 4.7 在電腦和瀏覽器操控場景下的解析度上限、思考深度配比及快取降本機制。 螢幕解析度直接決定了智能體點擊的精準度。Claude 4.6 解析截圖的長邊上限為 1568 像素,Opus 4.7 為 2576 像素。一旦截圖超出限制,API 服務端會自動等比例縮小圖片,這會導致模型生成的點擊座標與客戶端原圖產生錯位漂移。因此,開發者必須提前在客戶端將截圖縮放至 1280x720 (Claude 4.6 建議) 或 1080p (Opus 4.7 建議)。 介面操控主要依賴視覺感知與元素定位,對長鏈條邏輯推理要求不高。測試顯示,Opus 4.7 在低思考深度 (low) 下的操控表現便能追平 Sonnet 4.6 的最大思考深度 (max),且 token 成本僅為後者的十分之一。官方建議將思考選項設為 high,相較於 max 深度不僅 token 消耗減半,成功率也完全持平,應避免開啟 max 以防模型過度思考導致帳單翻倍。 由於單張截圖在上下文中最高消耗 1800 個 token,官方給出了三層降本方案:常駐 1 個系統級快取斷點,並將另 3 個斷點動態分配給最近幾輪工具的執行結果;在客戶端進行滾動剪枝,僅在上下文中保留最近 3 張截圖,其餘用佔位符替代;在上下文深度逼近 90% 時觸發總結壓縮。 此外,API 引入了批量工具 computer_batch,支援單次調用打包執行多項無視覺依賴的操作;並提供智能體顧問機制 (Advisor Tool),允許主模型在後台直接召喚高階的 Opus 模型來審計執行步驟。開發者還可透過錄製引導模式 (Teach Mode,即錄製用戶的真實操作軌跡並在回放時作為指令參考) 來大幅提升任務成功率。 (來源:BlockBeats)
查看原文
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見
聲明
。
打賞
按讚
回覆
轉發
分享
回覆
請輸入回覆內容
請輸入回覆內容
回覆
暫無回覆
熱門話題
查看更多
#
0成本拿2股SK海力士
159.68萬 熱度
#
美光市值超越Meta躋身全美前十
33.19萬 熱度
#
哥倫比亞VS葡萄牙
35.03萬 熱度
#
美國5月PCE通膨升至4.1%創三年新高
58.52萬 熱度
#
USD1鏈上質押享年化9.48%
99.66萬 熱度
已置頂
網站地圖
Opus 4.7低思考度壓過Sonnet 4.6最大值,Anthropic發布首份智能體操控調優指南