2 минуты для создания AI-поддержки! xAI запускает Voice Agent Builder без кода, голосовой тест побеждает OpenAI.

На рынок ИИ-голосовых客服 приходит серьезный разрушитель! xAI под руководством Маска сегодня (1-го числа) официально выпустила бета-версию "Voice Agent Builder", ориентированную на полностью бескодовое (No-code) управление, позволяющее пользователям за короткие 2 минуты создать ИИ-голосового агента корпоративного уровня. Платформа использует сквозную голосовую архитектуру, не только победившая GPT и Gemini в последних бенчмарках, но также поддерживает 2-минутное быстрое клонирование голоса и интеграцию с реальными телефонными номерами, а стоимость вычислительной мощности составляет всего 0,05 доллара за минуту. (Предыстория: Легендарный инвестор открыл огонь: SpaceX не AI-компания, xAI "полностью провалился", все 11 соучредителей ушли) (Дополнительный контекст: SpaceX впервые выпустила инвестиционные корпоративные облигации, "привлекла 89 миллиардов долларов"! Переподписка почти в 4 раза, Маск прокладывает путь для xAI и Starship) Содержание этой статьи Toggle

  • Отказ от сборной конструкции: сквозная архитектура победила GPT и Gemini
  • Процесс настройки за 2 минуты и четыре основные функции
  • Мгновенная наблюдаемость и защитные ограждения Компания xAI под руководством Илона Маска снова начинает яростную атаку на технологических гигантов. 1 июля 2026 года xAI официально объявила о запуске бета-версии Voice Agent Builder, заявив о внедрении высокопроизводительной модели Grok Voice в корпоративную производственную среду, значительно снизив технологический барьер. Эта платформа, разработанная для обработки высокочастотных и высоконагруженных телефонных звонков (таких как обслуживание клиентов, продажи, бронирование), ориентирована на "все в одном" и "без кода (No-code)", позволяя операторам получить готовые к использованию полные функции без необходимости создавать сложный голосовой стек с нуля.

Отказ от сборной конструкции: сквозная архитектура победила GPT и Gemini

В прошлом, для создания ИИ-голосового客服, компаниям обычно требовалось объединить три независимые системы: преобразование речи в текст (STT), большую языковую модель (LLM) и преобразование текста в речь (TTS). Такая "сборная" архитектура не только увеличивает задержку из-за множества точек перехода, но и значительно повышает уровень ошибок и эксплуатационные расходы. Voice Agent Builder от xAI полностью переворачивает это. Он использует сквозной путь Speech-to-Speech, тесно связанный с Grok Voice. Официальные лица подчеркивают, что Grok Voice обучен на реальных и "самых сложных" сценариях звонков, способен идеально справляться с низкокачественным телефонным шумом, сильным акцентом, прерываниями пользователя, а также нечеткими командами при изменении решения в середине разговора, и нативно поддерживает более 25 языков. В последнем опубликованном голосовом бенчмарке $\tau$-voice Bench версия Grok Voice Think Fast 1.0 одержала полную победу в рейтинге, превзойдя по скорости реакции и способности рассуждения таких сильных конкурентов, как Google Gemini 3.1 Flash Live и OpenAI GPT Realtime 1.5.

Процесс настройки за 2 минуты и четыре основные функции

xAI подчеркивает, что пользователям потребуется менее 2 минут, чтобы настроить выделенного голосового агента на платформе с помощью подсказок на естественном языке (Prompt). Ниже приведены основные функции и цены, предлагаемые платформой: | Функциональный модуль | | --- | Технические характеристики и детали поддержки | | --- | --- | | База знаний (Knowledge Base) | Поддерживает загрузку Word, Excel, PDF, JSON и других форматов, а также организацию в коллекции (Collections), общие для агентов, обеспечивая согласованность спецификаций продукта и политики. | | Инструменты и действия (Tools & Connectors) | Встроенная интеграция Google/Outlook Calendar, веб-поиск, поиск по X (Twitter) и Notion. Поддерживает перевод на живого оператора, завершение звонка и мгновенные уведомления команды. | | Голос и телефония (Voice & Telephony) | Предоставляет 80+ встроенных голосов, поддерживает "клонирование брендового голоса" всего за 2 минуты аудио. Можно бесплатно получить телефонный номер или подключить через SIP к существующей АТС. | | Прозрачное ценообразование (Pricing) | Стоимость API вычислительной мощности составляет 0,05 доллара за минуту (без дополнительной платы за платформу). Если использовать бесплатный телефонный номер от xAI, взимается дополнительная плата за связь в размере 0,01 доллара за минуту. |

Мгновенная наблюдаемость и защитные ограждения

Для корпоративных пользователей безопасность и управление рисками имеют решающее значение. Voice Agent Builder включает мощный механизм мониторинга (Observability) и защитные ограждения (Guardrails). Каждый звонок автоматически записывается и создается расшифровка, администраторы могут в любое время просматривать, какие инструменты использовал ИИ, и устанавливать строгие границы диалога (например: принудительно запретить ИИ читать номера кредитных карт клиентов или запретить обсуждение с пользователем непрофильных политических тем). В конце объявления xAI бросил вызов разработчикам и владельцам бизнеса по всему миру: «Слух точнее, чем смотреть на бенчмарки — создайте агента и позвоните с самым сложным рабочим процессом, чтобы попробовать». В настоящее время платформа уже доступна для пробного использования в xAI Console, что, как ожидается, вызовет огромные тектонические сдвиги в индустрии традиционного программного обеспечения для обслуживания клиентов.

Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Закреплено