Antigo CTO da OpenAI desafia a antiga empresa: Novo modelo responde em 200ms, superando o GPT em tempo real

De acordo com o monitoramento da Dongcha Beating, o laboratório Thinking Machines, fundado pela ex-CTO da OpenAI Mira Murati, lançou uma prévia de pesquisa do seu “modelo interativo”. O novo sistema abandona a abordagem tradicional de juntar voz e texto usando ferramentas externas, ao invés disso, lida nativamente com interações de áudio e vídeo em tempo real. O modelo pode receber informações continuamente com um “micro-turno” de 200ms, permitindo ouvir, assistir e falar simultaneamente, enquanto suporta interrupções em tempo real por parte dos utilizadores. O primeiro modelo apresentado, TML-Interaction-Small, emprega uma arquitetura MoE de 276 bilhões de parâmetros, ativando 12 bilhões de parâmetros de cada vez. Para resolver a falha do modelo grande tradicional de “parar a perceção ao gerar respostas”, a equipa de desenvolvimento dividiu o sistema em front-end e back-end: o modelo de front-end dedica-se a manter um diálogo ininterrupto, enquanto o modelo de back-end lida simultaneamente com raciocínio complexo, buscas na web ou geração de UI, transmitindo os resultados de forma fluida de volta ao front-end. Esta arquitetura supera diretamente a velocidade de resposta dos concorrentes da antiga empresa. Dados oficiais mostram que o atraso na rotação de voz é de apenas 0,40 segundos, atingindo uma pontuação de 77,8 no FD-bench V1.5, com ambos os métricos principais superando os do GPT-realtime-2.0 e Gemini 3.1 Flash Live. No entanto, o processamento contínuo de áudio e vídeo pode rapidamente esgotar a capacidade de contexto, e o efeito de baixa latência depende fortemente das condições de rede. A Thinking Machines planeja abrir uma pré-visualização limitada nos próximos meses.

Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixar