根据东查贝丁的监测,数据平台Scale Labs宣布了最新的Audio MC S2S排名。评估结果显示,Thinking Machines新发布的TML-Interaction-Small模型的APR得分为43.4%,与OpenAI的GPT-Realtime-2(xHigh)并列第一名。在具体得分方面,GPT-Realtime-2(xHigh)以48.45分位居绝对最高,紧随其后的是TML-Interaction-Small,得分为43.36分。由于得分差异在统计误差范围内,两个模型被正式评为并列第一。第二档次包括标准版的GPT-Realtime-2(37.61分)、启用思考模式的Gemini 3.1 Flash Live(36.06分)以及较旧的GPT-Realtime-1.5。Scale Labs指出,该模型在现有全双工模型中展现出罕见的长上下文感知能力,同时保持快速的对话响应速度。
第三者評価公開:Thinking Machinesの新モデルがGPT-Realtime-2と連携、オーディオランキングでトップに
根据东查贝丁的监测,数据平台Scale Labs宣布了最新的Audio MC S2S排名。评估结果显示,Thinking Machines新发布的TML-Interaction-Small模型的APR得分为43.4%,与OpenAI的GPT-Realtime-2(xHigh)并列第一名。在具体得分方面,GPT-Realtime-2(xHigh)以48.45分位居绝对最高,紧随其后的是TML-Interaction-Small,得分为43.36分。由于得分差异在统计误差范围内,两个模型被正式评为并列第一。第二档次包括标准版的GPT-Realtime-2(37.61分)、启用思考模式的Gemini 3.1 Flash Live(36.06分)以及较旧的GPT-Realtime-1.5。Scale Labs指出,该模型在现有全双工模型中展现出罕见的长上下文感知能力,同时保持快速的对话响应速度。