Инженер по ИИ в Tesla: оптимизация алгоритмов — не панацея, качество данных определяет предел возможностей ИИ

robot
Генерация тезисов в процессе
Новости сайта Coinjie, старший инженер по AI компании Tesla, Цай Юнда, отметил, что внешне часто считают, что 99% работы в проектах машинного обучения связаны с обучением, на самом деле время, затрачиваемое на обучение параметров модели, занимает всего 2%.
В то время как 50% усилий тратится на оценку тестов, 40% — на очистку данных, и еще 8% — на системную интеграцию.
Цай Юнда подчеркнул, что очистка данных и оценка определяют предел возможностей обучения AI.
Если исходные данные имеют неясное определение или противоречивую разметку, это вводит шум на источнике.
Любые магические алгоритмы или техники настройки параметров не смогут устранить фоновый шум, потому что модель не сможет самостоятельно исправить ошибочные учебники, и конечный предел точности полностью зависит от объема полезной информации в данных.
Чтобы обеспечить единые стандарты данных с самого начала, Цай Юнда заявил, что ежедневно пересматривает определения понятий данных и системы их классификации, даже неоднократно проверяет исторические метки.
Многие специалисты согласны и отмечают, что независимо от правил усиленного обучения или точной разметки при донастройке модели, на результативность AI всегда влияет качество данных и уровень оценки, а не сама архитектура модели.
Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • 5
  • 1
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
GateUser-e4351615
· 5ч назад
50% оценки важности системы верификации важнее, чем алхимия
Посмотреть ОригиналОтветить0
MemeFisher
· 5ч назад
Поэтому не стоит только хвалить количество параметров, сначала унифицируйте стандарты аннотирования.
Посмотреть ОригиналОтветить0
GateUser-470bc925
· 5ч назад
Качество данных действительно является потолком
Посмотреть ОригиналОтветить0
Lemon-FlavoredLiquidation
· 5ч назад
8% системная интеграция... похоже, развертывание — это скрытая большая ловушка
Посмотреть ОригиналОтветить0
EchoesOfMistValley
· 5ч назад
Определение исходных данных действительно является распространенной проблемой в отрасли, если верхнее проектирование выполнено плохо, всё остальное — только погашение долгов.
Посмотреть ОригиналОтветить0
  • Закреплено