AIMPACT 消息,5 月 3 日(UTC+8),Sakana AI推出混合架构KAME,可在保持接近零延迟的同时实时注入后端LLM知识。该系统由两个异步组件并行运行:前端基于Moshi架构的S2S模块以约80毫秒周期处理音频并立即生成响应;后端由STT组件和完整LLM组成,持续构建部分转录并生成oracle流式传回前端,当更好oracle到达时可中途修正响应。评估显示,单独Moshi得分2.05,KAME+gpt-4.1得分6.43,KAME+claude-opus-4-1得分6.23,延迟均与Moshi相当;领先级联系统Unmute得分7.70但延迟达2.1秒。KAME后端无关,支持在推理时切换LLM而无需重新训练。
Sakana AI推出KAME系统,延迟接近零的同时实现更深层知识注入
AIMPACT 消息,5 月 3 日(UTC+8),Sakana AI推出混合架构KAME,可在保持接近零延迟的同时实时注入后端LLM知识。该系统由两个异步组件并行运行:前端基于Moshi架构的S2S模块以约80毫秒周期处理音频并立即生成响应;后端由STT组件和完整LLM组成,持续构建部分转录并生成oracle流式传回前端,当更好oracle到达时可中途修正响应。评估显示,单独Moshi得分2.05,KAME+gpt-4.1得分6.43,KAME+claude-opus-4-1得分6.23,延迟均与Moshi相当;领先级联系统Unmute得分7.70但延迟达2.1秒。KAME后端无关,支持在推理时切换LLM而无需重新训练。