Cohere はオープンソースの音声書き起こしモデル Transcribe をリリースしました。


これは20億パラメータの Conformer ASR で、14の言語をサポートし、ローカル展開も可能です。また、API や Model Vault を利用でき、ダウンロードは直接 Hugging Face にあります。
推論環境を自分で管理し、会議の書き起こしやカスタマーサポートの音声、リアルタイムの音声エージェントを行う人はぜひご覧ください。HF Open ASR Leaderboard での平均 WER は 5.42%、この成績は非常に直感的です。
プロジェクトページ:
原文表示
post-image
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
コメントを追加
コメントを追加
コメントなし
  • ピン