AI语音客服市场迎来重量级破坏者!马斯克领军的xAI于今(1)日正式发布「Voice Agent Builder」Beta版,主打完全无程式码(No-code)操作,让用户在短短2分钟内就能建置出具备企业级水准的AI语音代理。该平台采用端到端语音架构,不仅在最新基准测试中击败了GPT与Gemini,更支持2分钟极速语音克隆与真实电话号码串接,每分钟算力成本仅需0.05美元。 (前情提要:传奇投资人开炮:SpaceX 不是 AI 公司、xAI 是「彻底翻车」11 位共同创办人全走光) (背景补充:SpaceX 首发投资级公司债「狂吸 890 亿镁」!超额认购近 4 倍,马斯克为 xAI 与星舰铺路)
本文目录
Toggle
马斯克(Elon Musk)旗下的 xAI 再度向科技巨头们发起猛烈攻势。2026 年 7 月 1 日,xAI 官方正式宣布推出 Voice Agent Builder(语音代理建置器) 的 Beta 版本,宣告将高效率的 Grok Voice 模型正式带入企业生产环境,且大幅降低了技术门槛。
这款专为处理高频率、高负载通话需求(如客服、销售、预约)设计的平台,主打「一体化」与「无程式码(No-code)」,让运营人员无需从头搭建复杂的语音堆叠,就能获得开箱即用的完整功能。
在过去,企业若要建置 AI 语音客服,通常需要将语音转文字(STT)、大型语言模型(LLM)与文字转语音(TTS)三个独立系统串接在一起。这种「拼装车」架构不仅增加了多跳点的延迟,也大幅提高了错误率与营运成本。
xAI 的 Voice Agent Builder 彻底颠覆了这点。它采用了与 Grok Voice 紧密耦合的端到端 Speech-to-Speech 单一语音路径。官方强调,Grok Voice 是使用真实且「最困难」的通话情境训练而成,能够完美应对低品质的电话杂音、强烈口音、用户中途打断,甚至是讲话到一半改变心意的模糊指令,并原生支持 25 种以上的语言。
在最新公布的语音基准测试 $\tau$-voice Bench 中,Grok Voice Think Fast 1.0 版本在排行榜上大获全胜,其反应速度与推理能力直接超越了强敌 Google 的 Gemini 3.1 Flash Live 以及 OpenAI 的 GPT Realtime 1.5。
xAI 强调,只需不到 2 分钟,用户就能通过自然语言提示(Prompt)在平台上设定好专属的语音代理。以下为平台提供的核心功能与计价拆解:
| 功能模块 | | --- | 技术规格与支持细节 | | --- | --- | | 知识库 (Knowledge Base) | 支持上传 Word、Excel、PDF、JSON 等多种格式,并可整理成跨代理共享的集合(Collections),确保产品规格与政策的一致性。 | | 工具与动作 (Tools & Connectors) | 内建串接 Google/Outlook 日历、Web 搜寻、X (Twitter) 搜寻及 Notion。支持转接真人客服、结束通话与即时团队通知。 | | 语音与电话 (Voice & Telephony) | 提供 80+ 内建语音,支持仅需 2 分钟音讯即可完成的「品牌语音克隆」。可免费获取电话号码或透过 SIP 串接现有总机。 | | 透明计价 (Pricing) | 算力 API 费用为 0.05 美元 / 分钟(免额外平台费)。若使用 xAI 免费提供的电话号码,则额外收取 0.01 美元 / 分钟的通讯费。 |
对于企业级用户而言,安全与风控至关重要。Voice Agent Builder 内建了强大的监控(Observability)机制与安全护栏(Guardrails)。每通电话皆会自动录音并生成逐字稿,管理员可以随时查看 AI 使用过哪些工具,并设定严格的对话边界(例如:强制禁止 AI 读出客户的信用卡卡号,或禁止与用户聊离题的政治话题)。
xAI 在公告最后向全球开发者与企业主发出挑战:「用耳朵判断比看基准测试更准确——建一个代理,用你最困难的工作流程打电话试试看。」目前该平台已于 xAI Console 正式上线开放试用,预计将对传统客服软件产业造成巨大的板块冲击。
14.15万 热度
784.36万 热度
56.6万 热度
383.82万 热度
5549.2万 热度
2 分钟打造 AI 客服!xAI 推出无代码语音智能体构建器,语音跑分击败 OpenAI
AI语音客服市场迎来重量级破坏者!马斯克领军的xAI于今(1)日正式发布「Voice Agent Builder」Beta版,主打完全无程式码(No-code)操作,让用户在短短2分钟内就能建置出具备企业级水准的AI语音代理。该平台采用端到端语音架构,不仅在最新基准测试中击败了GPT与Gemini,更支持2分钟极速语音克隆与真实电话号码串接,每分钟算力成本仅需0.05美元。 (前情提要:传奇投资人开炮:SpaceX 不是 AI 公司、xAI 是「彻底翻车」11 位共同创办人全走光) (背景补充:SpaceX 首发投资级公司债「狂吸 890 亿镁」!超额认购近 4 倍,马斯克为 xAI 与星舰铺路)
本文目录
Toggle
马斯克(Elon Musk)旗下的 xAI 再度向科技巨头们发起猛烈攻势。2026 年 7 月 1 日,xAI 官方正式宣布推出 Voice Agent Builder(语音代理建置器) 的 Beta 版本,宣告将高效率的 Grok Voice 模型正式带入企业生产环境,且大幅降低了技术门槛。
这款专为处理高频率、高负载通话需求(如客服、销售、预约)设计的平台,主打「一体化」与「无程式码(No-code)」,让运营人员无需从头搭建复杂的语音堆叠,就能获得开箱即用的完整功能。
抛弃拼装车,端到端架构击败 GPT 与 Gemini
在过去,企业若要建置 AI 语音客服,通常需要将语音转文字(STT)、大型语言模型(LLM)与文字转语音(TTS)三个独立系统串接在一起。这种「拼装车」架构不仅增加了多跳点的延迟,也大幅提高了错误率与营运成本。
xAI 的 Voice Agent Builder 彻底颠覆了这点。它采用了与 Grok Voice 紧密耦合的端到端 Speech-to-Speech 单一语音路径。官方强调,Grok Voice 是使用真实且「最困难」的通话情境训练而成,能够完美应对低品质的电话杂音、强烈口音、用户中途打断,甚至是讲话到一半改变心意的模糊指令,并原生支持 25 种以上的语言。
在最新公布的语音基准测试 $\tau$-voice Bench 中,Grok Voice Think Fast 1.0 版本在排行榜上大获全胜,其反应速度与推理能力直接超越了强敌 Google 的 Gemini 3.1 Flash Live 以及 OpenAI 的 GPT Realtime 1.5。
2 分钟建置流程与四大核心功能
xAI 强调,只需不到 2 分钟,用户就能通过自然语言提示(Prompt)在平台上设定好专属的语音代理。以下为平台提供的核心功能与计价拆解:
| 功能模块 | | --- | 技术规格与支持细节 | | --- | --- | | 知识库 (Knowledge Base) | 支持上传 Word、Excel、PDF、JSON 等多种格式,并可整理成跨代理共享的集合(Collections),确保产品规格与政策的一致性。 | | 工具与动作 (Tools & Connectors) | 内建串接 Google/Outlook 日历、Web 搜寻、X (Twitter) 搜寻及 Notion。支持转接真人客服、结束通话与即时团队通知。 | | 语音与电话 (Voice & Telephony) | 提供 80+ 内建语音,支持仅需 2 分钟音讯即可完成的「品牌语音克隆」。可免费获取电话号码或透过 SIP 串接现有总机。 | | 透明计价 (Pricing) | 算力 API 费用为 0.05 美元 / 分钟(免额外平台费)。若使用 xAI 免费提供的电话号码,则额外收取 0.01 美元 / 分钟的通讯费。 |
即时可观测性与安全护栏
对于企业级用户而言,安全与风控至关重要。Voice Agent Builder 内建了强大的监控(Observability)机制与安全护栏(Guardrails)。每通电话皆会自动录音并生成逐字稿,管理员可以随时查看 AI 使用过哪些工具,并设定严格的对话边界(例如:强制禁止 AI 读出客户的信用卡卡号,或禁止与用户聊离题的政治话题)。
xAI 在公告最后向全球开发者与企业主发出挑战:「用耳朵判断比看基准测试更准确——建一个代理,用你最困难的工作流程打电话试试看。」目前该平台已于 xAI Console 正式上线开放试用,预计将对传统客服软件产业造成巨大的板块冲击。