通义がFun-ASR1.5をリリース、方言認識を主打

robot
概要作成中
MEニュース、4月20日(UTC+8)、動察Beatingの監視によると、通義実験室は4月20日に音声認識モデルFun-ASR1.5をリリースし、阿里雲の百炼にAPIを展開、魔搭コミュニティでオンライン体験を公開しました。公式によると、このバージョンは単一モデルで30種類の言語、漢語の7大方言体系と20以上の地域アクセントをカバーし、もはや方言ごとにモデルを分けていません。 通義が示した内部評価によると、典型的な方言シナリオの文字誤り率は前バージョンと比較して56.2%低下し、5つの方言の正確率は90%以上、15種類は80%以上に達しています。古詩詞の認識も専用に最適化されており、公式が示した内部文字レベルの正確率は97%です。これらの数字は通義の自己評価から得られたもので、第三者の基準ではありません。 中国語音声認識で最も扱いにくい長尾の方言も、直接商用可能な能力セットに含まれ始めています。教育ライブ配信、地方行政のホットライン、インタビュー整理などのシナリオでは、接続側は地域アクセントごとに複数の認識チェーンを分ける必要がなくなり、展開が少し簡単になります。 (出典:BlockBeats)
原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
コメントを追加
コメントを追加
コメントなし