Тоньи запущен Fun-ASR1.5, ориентированный на распознавание диалектов

robot
Генерация тезисов в процессе
МЕ Новости, 20 апреля (UTC+8), согласно мониторингу 动察 Beating, лаборатория 通义 20 апреля выпустила модель распознавания речи Fun-ASR1.5, которая уже доступна через API на платформе 阿里云百炼 и открыта для онлайн-опыта в сообществе 魔搭. В официальной информации говорится, что эта версия использует одну модель для охвата 30 языков, семи основных диалектных систем китайского языка и более 20 региональных акцентов, больше не создавая отдельные модели по диалектам. Внутренние оценки, предоставленные 通义, показывают, что в типичных сценариях диалектов уровень ошибок в распознавании символов снизился относительно предыдущей версии на 56,2%, пять диалектов имеют точность более 90%, а 15 — более 80%. Распознавание классической поэзии также было выделено как отдельная область для специальной оптимизации, внутренняя точность на уровне символов, по данным официальных источников, составляет 97%. Все эти показатели основаны на внутренних тестах 通义, а не на сторонних бенчмарках. Самый сложный для обработки диалектный "длинный хвост" в китайском распознавании речи теперь включен в один набор возможностей, пригодных для коммерческого использования. Для таких сценариев, как образовательные трансляции, местные правительственные горячие линии и интервью, интеграция не требует разделения на разные цепочки распознавания по регионам и акцентам, что упрощает развертывание. (Источник: BlockBeats)
Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Закреплено