Бывший технический директор OpenAI бросает вызов старой компании: новая модель отвечает за 200 мс, превосходя GPT в реальном времени

Согласно мониторингу Dongcha Beating, лаборатория Thinking Machines, основанная бывшим CTO OpenAI Мира Мурати, выпустила предварительный исследовательский обзор своего «интерактивного модели». Новая система отказывается от традиционного подхода соединения голоса и текста с помощью внешних инструментов, вместо этого нативно обрабатывает взаимодействия в реальном времени с аудио и видео. Модель может непрерывно получать информацию с «микро-обратной связью» длительностью 200 мс, позволяя одновременно слушать, смотреть и говорить, а также поддерживать мгновенные прерывания со стороны пользователя. Первая демонстрируемая модель, TML-Interaction-Small, использует архитектуру MoE с 276 миллиардами параметров, активируя одновременно 12 миллиардов параметров. Чтобы решить проблему традиционной большой модели «остановки восприятия при генерации ответов», команда разработчиков разделила систему на фронтенд и бэкенд: фронтенд-модель предназначена для поддержания непрерывного диалога, в то время как бэкенд-модель одновременно занимается сложным рассуждением, поиском в интернете или генерацией интерфейса, бесшовно передавая результаты обратно на фронтенд. Эта архитектура напрямую превосходит по скорости отклика конкурентов старой компании. Официальные данные показывают, что задержка при голосовом воспроизведении составляет всего 0,40 секунд, достигая оценки 77,8 в FD-bench V1.5, при этом оба ключевых показателя превосходят GPT-realtime-2.0 и Gemini 3.1 Flash Live. Однако непрерывная обработка аудио и видео быстро исчерпывает емкость контекста, а эффект низкой задержки сильно зависит от условий сети. Thinking Machines планирует открыть ограниченный предварительный просмотр в ближайшие месяцы.

Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Закрепить