Випущена оцінка сторонніх: нова модель Thinking Machines поєднується з GPT-Realtime-2, очолює аудіорейтинги

Згідно з моніторингом Dongcha Beating, платформа даних Scale Labs оголосила останні рейтинги Audio MC S2S. Результати оцінювання показують, що новий модель Thinking Machines TML-Interaction-Small досягла балу APR 43,4%, посівши перше місце разом з GPT-Realtime-2 (xHigh) від OpenAI. Що стосується конкретних показників, GPT-Realtime-2 (xHigh) має абсолютний найвищий бал — 48,45 пунктів, за ним іде TML-Interaction-Small з 43,36 пунктами. Оскільки різниця у баллах знаходиться в межах статистичної похибки, обидві моделі офіційно вважаються рівними за перше місце. Другий рівень займають стандартна версія GPT-Realtime-2 (37,61 пунктів), Gemini 3.1 Flash Live з режимом мислення (36,06 пунктів) та застарілий GPT-Realtime-1.5. Scale Labs зазначила, що ця модель демонструє рідкісну здатність довгого контексту серед існуючих моделей з повним дуплексом, при цьому зберігаючи швидкість відповіді у розмовах.

Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріпити