10 зразків розширено до 242 мов, Adaption Labs має вирішити недоліки багатомовності ШІ на рівні даних

robot
Генерація анотацій у процесі

ME Новини повідомляють, 15 квітня (UTC+8), згідно з моніторингом 动察 Beating, платформа даних AI Adaption Labs випустила нову функцію Adaptive Data «Expand Your World», яка, починаючи з мінімум 10 зразків однієї мови, може генерувати до 2 420 високоякісних навчальних зразків, що охоплюють 242 мови та регіональні варіанти, без додаткових процесів маркування або каналів даних. Ця функція вже доступна для всіх користувачів Adaptive Data. Мульти-мовне охоплення є однією з головних проблем у тренувальних даних для ШІ. Більшість наборів даних зосереджені на кількох мовах з високим ресурсним забезпеченням, і здатність моделей обробляти малоресурсні мови та регіональні діалекти значно слабшає, а подальше тонке налаштування важко компенсувати. Ідея Adaption Labs полягає в тому, щоб перенести охоплення мов на рівень даних, вирішуючи проблему розподільчої упередженості вже на етапі створення тренувальних даних. Adaption Labs заснована колишньою віце-президенткою досліджень Cohere Сара Хукер та колишнім інженером інфраструктури AI Google Супітом Роєм, у лютому цього року компанія отримала початкове фінансування у розмірі 50 мільйонів доларів від Emergence Capital, з оцінкою у 1 мільярд доларів. Основна стратегія компанії — замінити масове масштабування ефективною системою адаптації, яка дозволяє моделям постійно навчатися та еволюціонувати. (Джерело: BlockBeats)

Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріпити