Cohere ha lanzado el modelo de transcripción de voz de código abierto Transcribe.


Es un ASR Conformer de 2 mil millones de parámetros, compatible con 14 idiomas, que se puede desplegar localmente, así como a través de API y Model Vault, con el enlace de descarga directamente en Hugging Face.
Aquellos que gestionan su propio entorno de inferencia, realizan transcripciones de reuniones, atención al cliente por voz y agentes de speech en tiempo real, pueden echarle un vistazo. El promedio de WER en la tabla de clasificación de HF Open ASR es de 5.42%, lo cual es un resultado bastante claro.
Página del proyecto:
Ver original
post-image
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Anclado