第三方评估发布:Thinking Machines的新模型与GPT-Realtime-2并列,位居音频排名榜首

根据东查贝丁的监测,数据平台Scale Labs宣布了最新的Audio MC S2S排名。评估结果显示,Thinking Machines新发布的TML-Interaction-Small模型的APR得分为43.4%,与OpenAI的GPT-Realtime-2(xHigh)并列第一。在具体得分方面,GPT-Realtime-2(xHigh)以48.45分位居绝对最高,紧随其后的是TML-Interaction-Small,得分为43.36分。由于分数差异在统计误差范围内,两个模型被正式评为并列第一。第二档次包括标准版的GPT-Realtime-2(37.61分)、启用思考模式的Gemini 3.1 Flash Live(36.06分)以及较早的GPT-Realtime-1.5。Scale Labs指出,该模型在现有全双工模型中展现出罕见的长上下文感知能力,同时在对话中保持快速响应速度。

查看原文
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 评论
  • 转发
  • 分享
评论
请输入评论内容
请输入评论内容
暂无评论