2 хвилини на створення AI-підтримки! xAI запускає Voice Agent Builder без коду, голосовий тест перемагає OpenAI

Ринок голосових AI-агентів отримує потужного руйнівника! xAI під керівництвом Маска сьогодні (1-го числа) офіційно випустив бета-версію "Voice Agent Builder", яка пропонує повністю безкодове (No-code) управління, дозволяючи користувачам створити AI-голосового агента корпоративного рівня всього за 2 хвилини. Платформа використовує наскрізну голосову архітектуру, перемагаючи GPT та Gemini в останніх тестах, підтримує швидке клонування голосу за 2 хвилини та інтеграцію з реальними телефонними номерами, а вартість обчислень становить лише 0,05 долара за хвилину.
(Передумова: Легендарний інвестор починає стріляти: SpaceX не є AI-компанією, xAI "повністю перевернувся" — всі 11 співзасновників пішли)
(Додатковий фон: SpaceX вперше випускає корпоративні облігації інвестиційного рівня "залучаючи 89 млрд доларів"! Підписка перевищує майже 4 рази, Маск прокладає шлях для xAI та Starship)

Зміст статті

Toggle

  • Відмова від збірних конструкцій: наскрізна архітектура перемагає GPT та Gemini
  • Процес створення за 2 хвилини та чотири основні функції
  • Миттєва спостережність та захисні бар'єри

xAI, що належить Ілону Маску (Elon Musk), знову завдає потужного удару технологічним гігантам. 1 липня 2026 року xAI офіційно оголосив про випуск бета-версії Voice Agent Builder, що знаменує впровадження високопродуктивної моделі Grok Voice у виробниче середовище підприємств із значним зниженням технологічного порогу.

Ця платформа, спеціально розроблена для обробки високочастотних та високонавантажених дзвінків (наприклад, обслуговування клієнтів, продажі, бронювання), пропонує "все в одному" та "безкодове (No-code) управління", дозволяючи операційному персоналу отримувати готові до використання повні функції без необхідності створювати складні голосові стекі з нуля.

Відмова від збірних конструкцій: наскрізна архітектура перемагає GPT та Gemini

Раніше для створення AI-голосового обслуговування клієнтів підприємствам часто потрібно було з'єднувати три незалежні системи: перетворення мови в текст (STT), велику мовну модель (LLM) та перетворення тексту в мову (TTS). Така "збірна" архітектура не лише збільшує затримку через множинні точки з'єднання, але й значно підвищує рівень помилок та операційні витрати.

Voice Agent Builder від xAI повністю змінює це. Він використовує наскрізний єдиний голосовий шлях Speech-to-Speech, тісно пов'язаний з Grok Voice. Офіційно наголошується, що Grok Voice навчається на реальних та "найскладніших" сценаріях дзвінків, що дозволяє ідеально справлятися з низькоякісним телефонним шумом, сильними акцентами, перериваннями користувача, а також нечіткими командами, коли користувач змінює думку під час розмови, і підтримує понад 25 мов.

В останньому голосовому тесті $\tau$-voice Bench модель Grok Voice Think Fast 1.0 перемогла в рейтингу, перевершивши за швидкістю реакції та здатністю до міркування безпосередніх конкурентів — Google Gemini 3.1 Flash Live та OpenAI GPT Realtime 1.5.

Процес створення за 2 хвилини та чотири основні функції

xAI наголошує, що менш ніж за 2 хвилини користувачі можуть налаштувати власного голосового агента на платформі за допомогою природномовних підказок (Prompt). Нижче наведено основні функції платформи та розбивка ціноутворення:

| Функціональний модуль | | --- | Технічні характеристики та деталі підтримки | | --- | --- | | База знань (Knowledge Base) | Підтримує завантаження файлів у різних форматах, включаючи Word, Excel, PDF, JSON тощо, і може бути організована в колекції (Collections), спільні для кількох агентів, забезпечуючи узгодженість специфікацій продукту та політик. | | Інструменти та дії (Tools & Connectors) | Вбудована інтеграція з Google/Outlook календарем, веб-пошуком, пошуком X (Twitter) та Notion. Підтримує переведення на живого оператора, завершення дзвінка та миттєві сповіщення команди. | | Голос та телефонія (Voice & Telephony) | Пропонує понад 80 вбудованих голосів, підтримує клонування голосу бренду, яке можна виконати всього за 2 хвилини аудіо. Можна безкоштовно отримати телефонний номер або інтегруватися з існуючою АТС через SIP. | | Прозоре ціноутворення (Pricing) | Вартість API обчислень становить 0,05 долара/хвилину (без додаткових платформних зборів). Якщо використовувати безкоштовний телефонний номер від xAI, додатково стягується 0,01 долара/хвилину за зв'язок. |

Миттєва спостережність та захисні бар'єри

Для корпоративних користувачів безпека та управління ризиками є надзвичайно важливими. Voice Agent Builder має вбудовані потужні механізми моніторингу (Observability) та захисні бар'єри (Guardrails). Кожен дзвінок автоматично записується та генерується розшифровка, адміністратори можуть у будь-який час переглядати, які інструменти використовував AI, та встановлювати чіткі межі розмови (наприклад, забороняти AI озвучувати номер кредитної картки клієнта або обговорювати непрофільні політичні теми).

Наприкінці оголошення xAI кидає виклик розробникам та підприємцям у всьому світі: "Оцінювати на слух точніше, ніж дивитися на тести — створіть агента, зателефонуйте йому з вашим найскладнішим робочим процесом і спробуйте." Наразі платформа вже доступна для тестування в консолі xAI Console, що, очікується, спричинить величезний зсув у традиційній індустрії програмного забезпечення для обслуговування клієнтів.

Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріплено