Ефективність політики запобігання дистиляції великих моделей під сумнівом: дистиляція — це лише швидкий шлях для даних незалежних лабораторій, блокування не може зупинити гонку китайського ШІ

robot
Генерація анотацій у процесі
Згідно з моніторингом Beating, щодо спроб Вашингтону та Anthropic заблокувати передові моделі для відрізання каналів «дистиляції» великих китайських моделей, колишній керівник міжнародної стратегії GitHub, засновник Interconnected Capital Кевін С. Сюй зазначив, що протидія дистиляції є лише частковим безвихідним шляхом для окремих незалежних лабораторій у Китаї через голод даних, і блокування API зовсім не може зупинити загальний прогрес китайського ШІ. Названі DeepSeek, Moon Shadow та MiniMax — це незалежні лабораторії, які не мають підтримки екосистеми групи, і стикаються з серйозною проблемою нестачі високоякісних даних для подальшого тренування, таких як кроки розуміння. У порівнянні з цим, великі лабораторії, що підтримуються Alibaba (Qwen), ByteDance (Seed) або Xiaomi, мають власні величезні сценарійні дані, що не поступаються Google та Apple, і не залежать від дистиляції. Тому політика блокування швидше за все створить короткострокові перешкоди для незалежних лабораторій, але не зможе похитнути основу великих китайських компаній. Поширене у світі уявлення про «перевагу даних» у Китаї є помилковим: у високоякісних даних для позначення знань та оцінки передових великих моделей, необхідних для тренування, Китай не має переваги, а навпаки — серйозно відстає від зрілих комерційних ланцюгів постачання даних, таких як Scale AI або Surge. Через низьку якість внутрішніх постачальників даних незалежні лабораторії, у відчаї та через лінь шукати легкий шлях, використовують API дистиляцію як дешеву стратегію отримання даних. Однак індустрія маркування даних — це низький поріг для бізнесу, і це не технічна проблема, як у випадку з фотонними машинами; внутрішній попит і пропозиція легко можуть бути заповнені. З довгострокової перспективи, чисті студентські моделі, що навчаються методом дистиляції, теоретично не зможуть перевершити своїх вчителів, але враховуючи, що великі моделі все ще створюються людськими інженерами, незалежно від того, чи США силою закриють API-канали, розумні та працьовиті китайські розробники зрештою зламають цей верхній межовий магічний бар’єр і створять моделі, що перевищують наставників. Політика блокування з боку США не лише безсилна, а й може раніше перервати теоретичний механізм, який тримає китайські моделі у «студентському» рівні.
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріплено