10个 образца расширены до 242 языков, Adaption Labs должен решить проблему многоязычия ИИ на уровне данных

robot
Генерация тезисов в процессе

ME News Новости, 15 апреля (UTC+8), согласно мониторингу 动察 Beating, платформа данных AI Adaption Labs выпустила новую функцию Adaptive Data «Expand Your World», которая, начиная с минимум 10 образцов на одном языке, может генерировать до 2 420 высококачественных обучающих образцов, охватывающих 242 языка и региональных вариантов, без необходимости дополнительных процессов маркировки или каналов данных. Эта функция уже доступна всем пользователям Adaptive Data. Многоязычное покрытие — одна из основных слабых сторон обучающих данных для AI. Большинство наборов данных сосредоточены на немногих языках с высоким ресурсом, и способность моделей обрабатывать малоресурсные языки и региональные диалекты значительно слабее, а последующая донастройка трудно компенсирует эти недостатки. Идея Adaption Labs заключается в переносе языкового охвата на уровень данных, решая проблему смещения распределения уже на этапе генерации обучающих данных. Adaption Labs основана бывшей вице-президентом по исследованиям Cohere Sara Hooker и бывшим инженером инфраструктуры AI Google Sudip Roy, в феврале этого года получила начальное финансирование в размере 50 миллионов долларов от Emergence Capital, оценка компании — 1 миллиард долларов. Основной ставкой компании является замена масштабных расширений эффективной адаптивной системой, позволяющей моделям постоянно учиться и эволюционировать. (Источник: BlockBeats)

Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Закрепить