xAI này kết hợp âm thanh khá mạnh, định giá theo dòng STT 0.2 đô la/giờ trực tiếp so sánh với Whisper, TTS còn đi kèm nhãn cảm xúc, Elon Musk đang muốn biến lĩnh vực thoại thành một chiến trường cạnh tranh khốc liệt đấy

XAI4,39%
STT3,84%
Xem bản gốc
MeNews
xAI mở API âm thanh STT và TTS của Grok, tỷ lệ lỗi từ tổng thể của STT giảm xuống còn 6.9%
Bản tin ME News đưa tin, xAI ra mắt hai API âm thanh độc lập: Grok STT và Grok TTS, xuất phát từ cùng một nền tảng âm thanh, hỗ trợ Grok Voice, hệ thống xe hơi Tesla và dịch vụ khách hàng Starlink, v.v.
STT cung cấp chuyển đổi hàng loạt qua REST và luồng dữ liệu theo thời gian thực qua WebSocket, có đánh dấu thời gian cấp từ, phân tách người nói, đa kênh và chuẩn hóa ngược văn bản, hỗ trợ hơn 25 ngôn ngữ; TTS hỗ trợ nhãn cảm xúc và nhấn điệu trong nội tuyến.
Đồng thời công bố so sánh WER, Grok dẫn đầu trong nhiều kịch bản, chưa có đánh giá lại từ bên thứ ba.
Giá cả: xử lý hàng loạt STT 0,10 USD/giờ, luồng dữ liệu 0,20 USD/giờ, TTS 4,20 USD/một triệu ký tự.
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Đã ghim