Mô hình giọng nói này còn có thể bắt được cả biểu cảm nhỏ, hàng triệu tổ hợp nhân cách, sau này các主播 ảo có lẽ sẽ khó phân biệt thật giả rồi

Xem bản gốc
MeNews
StepAudio 2.5 Phát hành âm thanh trực tiếp: Nhận thức ngôn ngữ phụ và tương tác cá nhân hóa
StepAudio 2.5 Realtime là một mô hình nhận dạng giọng nói theo thời gian thực, có thể nhận diện các đặc điểm phụ ngôn ngữ như ngữ điệu, tốc độ nói, sự dừng lại và biểu cảm nhỏ. Thông qua API có thể tích hợp nhân cách tùy chỉnh, thiết lập tính cách, câu chuyện nền và phong cách ngôn ngữ, sở hữu hàng vạn tùy chọn nhân cách gốc, tổ hợp có thể đạt tới hàng triệu đặc điểm. Được tích hợp 5 nhân cách mặc định, được tinh chỉnh bằng RLHF, có thể duy trì tính nhất quán trong các tình huống nhập vai phức tạp, hỗ trợ tiếng Trung và tiếng Anh.
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Đã ghim