Інженер з AI у Tesla: оптимізація алгоритмів — не панацея, якість даних визначає межу можливостей AI

robot
Генерація анотацій у процесі
Звіт з CoinWorld: старший інженер з штучного інтелекту компанії Tesla Цай Юнда зазначив, що зовнішній світ часто вважає, що 99% роботи у проектах машинного навчання припадає на тренування, але насправді час, витрачений на навчання моделей, становить лише 2%. У порівнянні з цим, 50% зусиль витрачається на оцінювання та тестування, 40% — на очищення даних, а ще 8% — на системну інтеграцію. Цай Юнда підкреслив, що очищення даних і оцінювання визначають межі, у яких AI може навчатися. Якщо початкові дані мають нечітке визначення або суперечливі позначки, це вводить шум у джерело даних. Будь-яка магія алгоритмів або техніки налаштування параметрів не зможе усунути фоновий шум, оскільки модель не може самостійно виправити помилкові підручники, і кінцева межа точності повністю залежить від обсягу корисної інформації у даних. Щоб забезпечити єдині стандарти даних з джерела, Цай Юнда зазначив, що щодня переглядає визначення понять і системи класифікації даних, навіть повторно перевіряє історичні позначки. Багато фахівців погоджуються і відзначають, що незалежно від правил підсиленого навчання або точності позначок для тонкої настройки моделей, на результати AI завжди впливає якість даних і рівень оцінювання, а не сама архітектура моделі.
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • 5
  • 1
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
GateUser-e4351615
· 5год тому
50% оцінка частки пояснення системи верифікації важливіша за алхімію
Переглянути оригіналвідповісти на0
MemeFisher
· 5год тому
Тому не лише хваліть кількість параметрів, спершу узгодьте стандарти позначення.
Переглянути оригіналвідповісти на0
GateUser-470bc925
· 5год тому
Якість даних дійсно є верхньою межею
Переглянути оригіналвідповісти на0
Lemon-FlavoredLiquidation
· 5год тому
8% системна інтеграція... Здається, розгортання — це прихований великий мінус
Переглянути оригіналвідповісти на0
EchoesOfMistValley
· 5год тому
Визначення початкових даних є розмитим — це справжня поширена проблема галузі, після поганого верхнього рівня проектування все доводиться повертати у борг.
Переглянути оригіналвідповісти на0
  • Закріплено