第三方評估發布:Thinking Machines 新模型與 GPT-Realtime-2 聯繫,位居音頻排名之首

根據東查比賽的監測,數據平台 Scale Labs 宣布了最新的 Audio MC S2S 排名。評估結果顯示,Thinking Machines 新推出的 TML-Interaction-Small 模型在 APR 分數上達到 43.4%,與 OpenAI 的 GPT-Realtime-2 (xHigh) 並列第一名。在具體分數方面,GPT-Realtime-2 (xHigh) 以 48.45 分位居絕對最高,緊隨其後的是 TML-Interaction-Small,得分為 43.36 分。由於分數差異在統計誤差範圍內,兩個模型正式被評為並列第一。第二層次包括標準版的 GPT-Realtime-2(37.61 分)、具備思考模式的 Gemini 3.1 Flash Live(36.06 分)以及較舊的 GPT-Realtime-1.5。Scale Labs 指出,該模型展現出在現有全雙工模型中罕見的長上下文感知能力,同時在對話中保持快速反應速度。
查看原文
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 打賞
  • 回覆
  • 轉發
  • 分享
回覆
請輸入回覆內容
請輸入回覆內容
暫無回覆