10 зразків розширено до 242 мов, Adaption Labs має вирішити багатомовний недолік AI на рівні даних

robot
Генерація анотацій у процесі

ME News Новини, 15 квітня (UTC+8), згідно з моніторингом Beating, платформа даних AI Adaption Labs випустила нову функцію Adaptive Data «Expand Your World», яка, починаючи з мінімум 10 зразків однієї мови, може генерувати до 2 420 високоякісних тренувальних зразків, що охоплюють 242 мови та регіональні варіанти, без додаткових процесів маркування або каналів даних. Ця функція вже доступна для всіх користувачів Adaptive Data. Мульти-мовне охоплення є однією з головних слабких сторін тренувальних даних для ШІ. Більшість датасетів зосереджені на кількох мовах з високим ресурсним забезпеченням, і здатність моделей обробляти малоресурсні мови та регіональні діалекти значно слабшає, а подальше тонке налаштування важко повністю компенсувати. Ідея Adaption Labs полягає в тому, щоб перенести охоплення мов на рівень даних, вирішуючи проблему розподільчої упередженості вже на етапі створення тренувальних даних. Adaption Labs заснована колишньою віце-президенткою досліджень Cohere Сара Хукер та колишнім інженером інфраструктури AI Google Судіпом Роєм. У лютому цього року компанія залучила 50 мільйонів доларів у посівному раунді з провідною інвестицією Emergence Capital, оцінюючи компанію в 1 мільярд доларів. Основна стратегія компанії — замінити масове масштабування ефективною системою адаптації, яка дозволяє моделям постійно навчатися та еволюціонувати. (Джерело: BlockBeats)

Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріпити