Тоні запущено Fun-ASR1.5, орієнтований на розпізнавання діалектів

robot
Генерація анотацій у процесі
ME Новини повідомляють, 20 квітня (UTC+8), згідно з моніторингом Beating, лабораторія Tongyi випустила модель розпізнавання мови Fun-ASR1.5, яка вже доступна через API на Alibaba Cloud Bailing та відкрито для онлайн-опробування в спільноті Modao. Офіційно заявлено, що ця версія використовує одну модель для покриття 30 мов, семи основних діалектів китайської та понад 20 регіональних акцентів, більше не створюючи окремі моделі для кожного діалекту. Внутрішні оцінки Tongyi показують, що помилка у розпізнаванні слів у типових сценаріях діалектів зменшилася на 56,2% у порівнянні з попередньою версією, 5 діалектів мають точність понад 90%, а 15 — понад 80%. Розпізнавання класичних поезій також було виділено окремо для спеціальної оптимізації, внутрішня точність на рівні символів становить 97%. Ці цифри отримані внутрішніми тестами Tongyi, а не сторонніми стандартами. Найскладніший для обробки діалект у китайському розпізнаванні мови — довгий хвіст, тепер включений до однієї системи, готової до комерційного використання. Для освітніх трансляцій, місцевих урядових гарячих ліній та інтерв’ю, підключення більше не вимагає створення окремих лінків розпізнавання за регіонами, що спрощує розгортання. (Джерело: BlockBeats)
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріплено