Cohere đã phát hành mô hình chuyển đổi giọng nói mã nguồn mở Transcribe.


Nó là một Conformer ASR với 2 tỷ tham số, hỗ trợ 14 ngôn ngữ, có thể triển khai cục bộ, cũng có thể sử dụng API và Model Vault, liên kết tải xuống trực tiếp trên Hugging Face.
Những người tự quản lý môi trường suy luận, làm chuyển đổi cuộc họp, thoại dịch vụ khách hàng và tác nhân speech thời gian thực có thể xem qua. Trên bảng xếp hạng HF Open ASR, trung bình WER là 5.42%, thành tích này đủ rõ ràng.
Trang dự án:
Xem bản gốc
post-image
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Ghim