Тоньи запущен Fun-ASR1.5, ориентированный на распознавание диалектов

robot
Генерация тезисов в процессе
МЕ Новости, 20 апреля (UTC+8), согласно мониторингу 动察 Beating, лаборатория 通义 20 апреля выпустила модель распознавания речи Fun-ASR1.5, которая уже доступна через API на платформе 阿里云百炼 и открыта для онлайн-опыта в сообществе 魔搭. Официально заявлено, что эта версия использует одну модель для охвата 30 языков, семи основных диалектных систем китайского языка и более 20 региональных акцентов, больше не разделяя модели по диалектам. Внутренние оценки, предоставленные 通义, показывают, что в типичных сценариях диалектов уровень ошибок в распознавании символов снизился относительно предыдущей версии на 56,2%, 5 диалектов имеют точность более 90%, а 15 — более 80%. Распознавание классической поэзии также было выделено отдельной задачей с проведённой специальной оптимизацией, внутренняя точность на уровне символов, по данным официальных, составляет 97%. Все эти показатели основаны на внутренних тестах 通义, а не на сторонних бенчмарках. Самый сложный для обработки диалектный хвост в китайском распознавании речи начал включаться в единый набор возможностей, пригодных для коммерческого использования. Для сценариев таких как образовательные трансляции, местные правительственные горячие линии и интервью, интеграция больше не требует разделения по региональным акцентам, что упрощает развертывание. (Источник: BlockBeats)
Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Закреплено