2 phút xây dựng AI hỗ trợ khách hàng! xAI ra mắt Voice Agent Builder không cần code, điểm số giọng nói đánh bại OpenAI

Thị trường AI voice customer service chào đón một kẻ phá vỡ nặng ký! xAI do Elon Musk lãnh đạo hôm nay (ngày 1) chính thức phát hành phiên bản Beta của "Voice Agent Builder", chủ đạo là vận hành hoàn toàn không cần code (No-code), cho phép người dùng xây dựng một AI voice agent đạt trình độ doanh nghiệp chỉ trong 2 phút. Nền tảng này sử dụng kiến trúc giọng nói end-to-end, không chỉ đánh bại GPT và Gemini trong các bài kiểm tra chuẩn mới nhất, mà còn hỗ trợ nhân bản giọng nói siêu tốc 2 phút và kết nối số điện thoại thực, chi phí tính toán mỗi phút chỉ 0,05 USD.
(Tin trước: Nhà đầu tư huyền thoại lên tiếng: SpaceX không phải công ty AI, xAI là "thất bại hoàn toàn" khi 11 nhà đồng sáng lập đều ra đi)
(Bổ sung bối cảnh: SpaceX phát hành trái phiếu doanh nghiệp cấp đầu tư đầu tiên "hút 89 tỷ USD"! Gấp gần 4 lần đăng ký mua, Musk mở đường cho xAI và Starship)

Mục lục

Toggle

  • Từ bỏ kiểu ráp nối, kiến trúc end-to-end đánh bại GPT và Gemini
  • Quy trình xây dựng 2 phút và bốn chức năng cốt lõi
  • Khả năng quan sát thời gian thực và hàng rào bảo mật

xAI thuộc Elon Musk một lần nữa mở cuộc tấn công dữ dội vào các gã khổng lồ công nghệ. Ngày 1 tháng 7 năm 2026, xAI chính thức công bố ra mắt phiên bản Beta của Voice Agent Builder (Trình xây dựng voice agent), tuyên bố đưa mô hình Grok Voice hiệu suất cao vào môi trường sản xuất doanh nghiệp, đồng thời giảm đáng kể rào cản kỹ thuật.

Nền tảng này được thiết kế để xử lý các nhu cầu cuộc gọi tần suất cao, tải trọng lớn (như dịch vụ khách hàng, bán hàng, đặt lịch), chủ đạo là "tích hợp một thể" và "không cần code (No-code)", cho phép nhân viên vận hành không cần xây dựng từ đầu các chồng giọng nói phức tạp, mà vẫn có được chức năng hoàn chỉnh dùng ngay.

Từ bỏ kiểu ráp nối, kiến trúc end-to-end đánh bại GPT và Gemini

Trước đây, nếu doanh nghiệp muốn xây dựng AI voice customer service, thường phải kết nối ba hệ thống độc lập: chuyển giọng nói thành văn bản (STT), mô hình ngôn ngữ lớn (LLM) và chuyển văn bản thành giọng nói (TTS). Kiến trúc "ráp nối" này không chỉ làm tăng độ trễ đa điểm, mà còn làm tăng đáng kể tỷ lệ lỗi và chi phí vận hành.

Voice Agent Builder của xAI hoàn toàn thay đổi điều này. Nó sử dụng đường dẫn giọng nói duy nhất end-to-end Speech-to-Speech liên kết chặt chẽ với Grok Voice. Công ty nhấn mạnh, Grok Voice được huấn luyện bằng các tình huống cuộc gọi thực tế và "khó khăn nhất", có thể xử lý hoàn hảo các tiếng ồn điện thoại chất lượng thấp, giọng địa phương mạnh, người dùng ngắt giữa chừng, thậm chí cả các hướng dẫn mơ hồ khi thay đổi ý giữa chừng, và hỗ trợ tự nhiên hơn 25 ngôn ngữ.

Trong bài kiểm tra giọng nói chuẩn mới nhất $\tau$-voice Bench, phiên bản Grok Voice Think Fast 1.0 đã chiến thắng hoàn toàn trên bảng xếp hạng, tốc độ phản hồi và khả năng suy luận của nó trực tiếp vượt qua đối thủ nặng ký Google Gemini 3.1 Flash Live và OpenAI GPT Realtime 1.5.

Quy trình xây dựng 2 phút và bốn chức năng cốt lõi

xAI nhấn mạnh, chỉ mất chưa đầy 2 phút, người dùng có thể thiết lập voice agent riêng trên nền tảng thông qua gợi ý ngôn ngữ tự nhiên (Prompt). Dưới đây là các chức năng cốt lõi và phân tích giá của nền tảng:

| Module chức năng | | --- | Chi tiết kỹ thuật và hỗ trợ | | --- | --- | | Cơ sở tri thức (Knowledge Base) | Hỗ trợ tải lên nhiều định dạng như Word, Excel, PDF, JSON, và có thể sắp xếp thành các bộ sưu tập (Collections) chia sẻ giữa các agent, đảm bảo tính nhất quán của thông số sản phẩm và chính sách. | | Công cụ và hành động (Tools & Connectors) | Tích hợp sẵn Google/Outlook Calendar, Web Search, X (Twitter) Search và Notion. Hỗ trợ chuyển tiếp đến nhân viên hỗ trợ thực, kết thúc cuộc gọi và thông báo nhóm thời gian thực. | | Giọng nói và điện thoại (Voice & Telephony) | Cung cấp hơn 80 giọng nói tích hợp sẵn, hỗ trợ "nhân bản giọng nói thương hiệu" chỉ cần âm thanh 2 phút. Có thể nhận số điện thoại miễn phí hoặc kết nối tổng đài hiện có qua SIP. | | Giá minh bạch (Pricing) | Phí API tính toán là 0,05 USD/phút (không phí nền tảng bổ sung). Nếu sử dụng số điện thoại miễn phí do xAI cung cấp, sẽ thu thêm phí liên lạc 0,01 USD/phút. |

Khả năng quan sát thời gian thực và hàng rào bảo mật

Đối với người dùng cấp doanh nghiệp, an toàn và quản lý rủi ro là rất quan trọng. Voice Agent Builder tích hợp cơ chế quan sát (Observability) mạnh mẽ và hàng rào bảo mật (Guardrails). Mỗi cuộc gọi sẽ tự động được ghi âm và tạo bản ghi nguyên văn, quản trị viên có thể xem AI đã sử dụng công cụ nào bất kỳ lúc nào, và thiết lập ranh giới hội thoại nghiêm ngặt (ví dụ: bắt buộc cấm AI đọc số thẻ tín dụng của khách hàng, hoặc cấm nói chuyện với người dùng về các chủ đề chính trị lạc đề).

xAI kết thúc thông báo bằng lời thách thức đến các nhà phát triển và chủ doanh nghiệp toàn cầu: "Đánh giá bằng tai chính xác hơn nhìn vào bài kiểm tra chuẩn – hãy xây dựng một agent, gọi điện thử với quy trình làm việc khó khăn nhất của bạn." Hiện tại nền tảng này đã chính thức lên sóng trên xAI Console để dùng thử, dự kiến sẽ gây ra tác động lớn đến ngành công nghiệp phần mềm dịch vụ khách hàng truyền thống.

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Đã ghim