STT tỷ lệ lỗi từ thấp hơn các đối thủ cạnh tranh, TTS còn có thể sử dụng nhãn để điều chỉnh ngữ điệu một cách tinh vi, cùng một bộ công nghệ được cung cấp cho Grok Voice, Tesla và Starlink—Elon Musk đang muốn nắm rõ toàn bộ quy trình từ đầu đến cuối của tương tác bằng giọng nói.

Xem bản gốc
MeNews
xAI ra mắt API Chuyển đổi giọng nói thành văn bản và văn bản thành giọng nói Grok
ME News đưa tin, xAI chính thức ra mắt hai API âm thanh độc lập là Grok STT và Grok TTS. Grok STT có độ chính xác cao, độ trễ thấp, hỗ trợ xử lý hàng loạt qua REST, chuyển đổi trực tiếp qua WebSocket, có đánh dấu thời gian theo từ, phân tách người nói, đa kênh và chuẩn hóa ngược văn bản thông minh, hỗ trợ hơn 25 ngôn ngữ; giá hàng loạt 0,10 USD/giờ, dòng 0,20 USD/giờ, tỷ lệ lỗi từ thấp hơn nhiều đối thủ. Grok TTS cung cấp giọng nói nhanh, tự nhiên, có thể kiểm soát chi tiết qua nhãn, giá 4,20 USD mỗi triệu ký tự. Cả hai dựa trên cùng một nền tảng công nghệ, phục vụ cho Grok Voice, Tesla và Starlink.
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Đã ghim