Эффективность политики предотвращения дистилляции больших моделей вызывает сомнения: дистилляция — это всего лишь быстрый способ получения данных для независимых лабораторий, блокировка не может остановить гонку китайских ИИ

robot
Генерация тезисов в процессе
По данным мониторинга Beating, в ответ на попытки Вашингтона и Anthropic заблокировать передовые модели для разрыва канала «дистилляции» китайских больших моделей, бывший руководитель международной стратегии GitHub и основатель Interconnected Capital Кевин С. Сюй отметил, что противодействие дистилляции — лишь вынужденный краткосрочный обход для некоторых независимых лабораторий Китая, страдающих от нехватки данных, а блокировка API в корне не способна остановить общий прогресс китайского ИИ.
Упомянутые DeepSeek, Луна Тьмы и MiniMax — это независимые лаборатории без поддержки экосистемы группы, сталкивающиеся с острой нехваткой высококачественных данных для рассуждений и последующего обучения.
В отличие от них, крупные лаборатории, поддерживаемые Alibaba (Qwen), ByteDance (Seed) или Xiaomi, обладают собственными огромными сценарийными данными, не уступающими Google и Apple, и не зависят от дистилляции.
Поэтому политика блокировки в лучшем случае создаст краткосрочные препятствия для независимых лабораторий, но не сможет поколебать основу крупных китайских компаний.
Распространённое мнение о «преимуществе данных» в Китае — это заблуждение: в области высококачественной разметки знаний и оценочных данных, необходимых для обучения передовых больших моделей, у Китая нет преимущества, а наоборот — серьёзно не хватает зрелых коммерческих цепочек поставок данных, таких как Scale AI или Surge.
Из-за низкого качества отечественных поставщиков данных, в отчаянии и по инерции поиска лёгких путей, независимые лаборатории прибегают к API-дистилляции как к недорогой стратегии получения данных.
Однако индустрия разметки данных — это бизнес с низким порогом входа, и это не технологическая проблема, подобная фотолитографии; внутренний спрос и предложение легко могут быть восполнены.
В долгосрочной перспективе, чистая дистилляция студентских моделей теоретически не сможет превзойти учителя, но поскольку большие модели всё равно создаются инженерами-человеками, независимо от того, будут ли США принудительно блокировать API-каналы, умные и трудолюбивые китайские разработчики в конечном итоге сломают этот предел, создав модели, превосходящие наставников.
Политика блокировки США не только неэффективна, но и может преждевременно прервать теоретические ограничения, которые позволяют удерживать китайские модели в «ученической» рамке.
Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Закреплено