Ефективність політики запобігання дистиляції великих моделей викликає сумніви: дистиляція — це лише швидкий шлях для даних незалежних лабораторій, блокування не може зупинити гонку китайського ШІ

robot
Генерація анотацій у процесі
За даними моніторингу Beating, щодо спроб Вашингтону та Anthropic заблокувати передові моделі для відрізання каналів «дистиляції» великих китайських моделей, колишній керівник міжнародної стратегії GitHub та засновник Interconnected Capital Кевін С. Сюй зазначив, що протидія дестиляції є лише частковим безвихідним шляхом для окремих незалежних лабораторій у Китаї через голод у даних, і блокування API зовсім не може зупинити загальний прогрес китайського ШІ.

Зазначені DeepSeek, Moon Shadow та MiniMax — це незалежні лабораторії, які не мають підтримки екосистеми групи, і стикаються з серйозною проблемою нестачі високоякісних даних для обробки та подальшого навчання, таких як кроки логіки. У порівнянні з цим, великі лабораторії, що підтримуються Alibaba (Qwen), ByteDance (Seed) або Xiaomi, мають власні величезні сценарійні дані, що не поступаються Google та Apple, і не залежать від дистиляції. Тому політика блокування швидше за все створить короткострокові перешкоди для незалежних лабораторій, але не зможе похитнути основу великих китайських компаній.

Поширена думка про «перевагу даних» у Китаї є помилкою: у сфері високоякісної аннотації знань та оцінювальних даних, необхідних для тренування передових великих моделей, у Китаї не лише немає переваги, а й серйозно бракує зрілих комерційних ланцюгів постачання даних, таких як Scale AI або Surge. Через низьку якість внутрішніх постачальників даних незалежні лабораторії, у відчаї та через лінь шукати швидкі рішення, використовують API дистиляцію як дешеву стратегію отримання даних.

Однак індустрія аннотації даних — це низький поріг для бізнес-моделі, і це не технічна проблема, як у випадку з фотонними машинами, — внутрішній попит і пропозиція легко можуть бути заповнені. З довгострокової перспективи, студентські моделі, що навчаються методом дистиляції, теоретично не зможуть перевершити вчителя, але оскільки великі моделі все ще створюються людськими інженерами, незалежно від того, чи США силою закриють API-канали, розумні та працьовиті китайські розробники зрештою зламають цей верхній межовий закляття і створять моделі, що перевищують наставника. Політика блокування США не лише безсилна, а й може раніше перервати теоретичний механізм, який тримає китайські моделі у «студентському» рівні, фактично закриваючи шлях до їхнього подальшого розвитку.
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріплено