Эффективность политики предотвращения дистилляции больших моделей вызывает сомнения: дистилляция — это всего лишь быстрый способ получения данных для независимых лабораторий, блокировка не может остановить гонку китайских ИИ

robot
Генерация тезисов в процессе
По данным мониторинга Beating, в ответ на попытки Вашингтона и Anthropic заблокировать передовые модели для разрыва канала «дистилляции» китайских больших моделей, бывший руководитель международной стратегии GitHub и основатель Interconnected Capital Кевин С. Сюй отметил, что противодействие дистилляции — лишь вынужденный краткосрочный обходной путь для некоторых независимых лабораторий Китая, страдающих от нехватки данных, а блокировка API в корне не способна остановить общий прогресс китайского ИИ.

Обвиняемые в этом DeepSeek, Moonshade и MiniMax — независимые лаборатории без поддержки экосистемы группы, сталкивающиеся с острой нехваткой высококачественных данных для рассуждений и последующего обучения. В отличие от них, крупные лаборатории, поддерживаемые Alibaba (Qwen), ByteDance (Seed) или Xiaomi, обладают собственными огромными сценарийными данными, не уступающими по объему Google и Apple, и не зависят от дистилляции. Поэтому политика блокировки в лучшем случае создаст краткосрочные препятствия для независимых лабораторий, но не сможет поколебать основу крупных китайских компаний.

Распространенное мнение о «преимуществе данных» в Китае — это заблуждение: в области высококачественной разметки знаний и оценочных данных, необходимых для обучения передовых больших моделей, у Китая нет преимущества, а наоборот — наблюдается серьезный дефицит зрелых коммерческих цепочек поставок данных, таких как Scale AI или Surge. Из-за низкого качества отечественных поставщиков данных, в отчаянии и по инерции поиска легких путей, независимые лаборатории прибегают к API-дистилляции как к дешевому способу получения данных.

Однако индустрия разметки данных — это бизнес с низким порогом входа, и это не технологическая проблема, подобная фотолитографическим машинам; внутренний спрос и предложение легко могут быть уравновешены. В долгосрочной перспективе, хотя модели-ученики, основанные на чистой дистилляции, теоретически не смогут превзойти учителя, поскольку большие модели по-прежнему создаются инженерами-человеками, умные и трудолюбивые китайские разработчики в конечном итоге сломают этот предел, создав модели, превосходящие наставников. Политика блокировки США не только неэффективна, но и может преждевременно прервать теоретические ограничения, которые позволяют удерживать китайские модели на уровне «учеников», — тем самым лишая возможности развития более продвинутых моделей.
Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Закреплено