xAI API âm thanh này có giá khá thú vị, STT hàng loạt chỉ 0.1 đô la/giờ, TTS lại đắt đến 4.2 đô la/một triệu ký tự, có phải là phí cao cho nhãn cảm xúc không?

Xem bản gốc
MeNews
xAI mở rộng API âm thanh Grok STT và TTS, tỷ lệ lỗi từ toàn bộ của STT giảm xuống còn 6.9%
Bản tin ME News đưa tin, xAI ra mắt hai API âm thanh độc lập: Grok STT và Grok TTS, xuất phát từ cùng một nền tảng âm thanh, hỗ trợ Grok Voice, hệ thống xe hơi Tesla và dịch vụ khách hàng Starlink. STT cung cấp chuyển đổi hàng loạt qua REST và luồng dữ liệu theo thời gian thực qua WebSocket, có đánh dấu thời gian cấp từ, phân tách người nói, đa kênh và chuẩn hóa ngược văn bản, hỗ trợ hơn 25 ngôn ngữ; TTS hỗ trợ nhãn cảm xúc và nhấn điệu trong nội tuyến. Đồng thời công bố so sánh WER, Grok dẫn đầu trong nhiều kịch bản, chưa có đánh giá lại từ bên thứ ba. Giá cả: xử lý hàng loạt STT 0,10 USD/giờ, streaming 0,20 USD/giờ, TTS 4,20 USD/triệu ký tự.
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận