なぜ中国のAIはこれほど速く発展しているのか?答えは研究室の内部に隠されている

原文タイトル:中国AI研究所内部からのメモ
原文作者:Nathan Lambert
翻訳:Peggy、BlockBeats

原文作者:律動BlockBeats

原文出典:

転載:火星财经

編集者の一言:中国のAI研究所は、ますます世界的な大規模モデル競争の中で無視できない存在になりつつある。その優位性は、単に人材が多い、エンジニアリングが強い、イテレーションが速いだけでなく、非常に現実的な組織運営の方式に由来している:概念よりもモデルの構築に重きを置き、個人のスター性よりもチームの実行力を重視し、外部サービスへの依存を減らし、コア技術スタックを自ら掌握しようとする。

本稿の著者Nathan Lambertは、中国の主要なAI研究所を訪問した結果、中国のAIエコシステムは米国と完全に同じではないことに気づいた。米国はオリジナリティのパラダイム、資本投入、トップ科学者の個人影響力を重視する一方、中国は既存の方向性の中で迅速に追いつき、オープンソース、エンジニアリングの最適化、多くの若手研究者の投入によって、モデルの能力を最前線に押し上げている。

最も注目すべきは、中国のAIがすでに米国を超えたかどうかではなく、異なる二つの発展経路が形成されつつあることである。米国は資本とスター研究所による最先端競争に近く、中国はエンジニアリング能力、オープンエコシステム、技術的自己管理意識に支えられた産業競争に近い。

これは、将来のAI競争が単なるモデルのランキング争いだけでなく、組織能力、開発者エコシステム、産業の実行力の争いにもなることを意味している。中国のAIの真の変化は、単なるシリコンバレーの模倣から、独自の方法でグローバル最前線に参加し始めている点にある。

以下は原文です:

杭州から上海へ向かう新幹線の車窓から、私は外の景色を眺めていた。起伏のはっきりした山脊、山上に点在する風力タービン、夕陽に照らされてシルエットを描く。背景には山々が広がり、目の前には広大な田畑と高層ビルの交錯する景色が広がる。

私は謙虚な気持ちで中国から帰国した。見知らぬ土地に行き、これほど温かく迎えられるのは、とても温かく人情味のある体験だ。私は幸運にもAIエコシステムの多くの人々と会うことができた。彼らは以前は遠くからしか知り得なかった人々だが、彼らの明るい笑顔と熱意に迎えられ、改めて気づかされた。私の仕事とAIエコシステムそのものが、世界的なものであることを。

中国の研究者の心構え

言語モデルを構築している中国企業は、「迅速な追随者」として非常に適していると言える。彼らは中国の長い教育と労働文化の伝統に基づきつつ、西洋とはやや異なる技術企業の構築方式も持ち合わせている。

成果だけを見ると、最新かつ最大のモデルや、それらが支えるエージェント型ワークフローに注目すれば、中国の研究所と米国の研究所は大きく変わらないように見える。優秀な科学者、大規模なデータ、加速計算資源といった投入要素も似通っている。しかし、長期的に本当に差が出るのは、これらの要素がどのように組織され、どのように形成されているかにある。

私は常々、中国の研究所が追いつき、最前線に留まるのが非常に得意なのは、文化的にこのタスクと非常に相性が良いためだと考えてきた。しかし、直接人と話す前は、その直感を何か重要な影響に帰すのは適切ではないと思っていた。多くの謙虚でオープンな優秀な科学者と話した結果、私の考えはより明確になった。

最良の大規模言語モデルを構築するには、技術スタック全体にわたる細部へのこだわりが重要だ。データからアーキテクチャの詳細、強化学習アルゴリズムの実装まで、各段階で改善の余地がある。そして、それらの改善をどう組み合わせるかは複雑な作業だ。この過程では、非常に賢い個人の仕事が一時的に棚上げされることもあり、全体の多目的最適化の最大化を図る必要がある。

米国の研究者も単一コンポーネントの解決には非常に長けているが、米国文化には「自己主張」の傾向が強い。科学者として、自分の仕事に積極的に注目を集めようとすれば成功しやすいし、また、現代の文化は「トップAI科学者」になる新たな道を推進している。これが直接的な対立を生む。

外界では、Llamaの組織はこれらの利益追求が階層化された組織に埋め込まれた後、政治的圧力により崩壊したとの噂もある。私も他の研究所から聞いたことがあるが、時には「トップ研究者をなだめて、最終モデルに彼らのアイデアが入らなかったことを許容させる」必要もある。真偽はともかく、明らかなのは、自己意識と職業的昇進欲求が、最良のモデル構築を妨げることもあるということだ。米国と中国の間、たとえ文化的な微細な差異であっても、最終的な成果に意味のある影響を与える可能性がある。

この差異の一部は、中国が誰によってこれらのモデルを構築しているかに関係している。すべての研究所に共通するのは、コアな貢献者の中に、まだ学生である割合が非常に高いことだ。これらの研究所は非常に若く、私たちのAi2の組織方式を思い起こさせる。学生は仲間として扱われ、直接大規模言語モデルのチームに組み込まれている。

これは米国のトップ研究所とは大きく異なる。米国では、OpenAIやAnthropic、Cursorなどはインターンシップをほとんど提供しない。Googleなども名目上Gemini関連のインターンを提供しているが、多くの人は、自分のインターンが本質的なコア作業から隔離されるのではと心配している。

要約すると、この微妙な文化差異は、モデル構築能力を高めるために次のように作用している:最終的なモデルの向上のために、あまり華やかでない作業を進んで行う意欲が高まる。AI構築に最初に関わる人々は、過去のAIブームの影響をあまり受けていないため、新しい技術に素早く適応できる。実際、私が会った中国の科学者の一人は、これを明確に長所と見なしている。自己意識の低さにより、組織の拡張も比較的容易になる。多くの人材は、すでに概念実証済みの問題を解決するのに適している、など。

このような、現代の言語モデル構築に有利な能力志向は、次のような既知のステレオタイプと対照的だ:人々は中国の研究者は、より創造的で新しい領域を切り開く「ゼロからイチ」の学術研究をあまり生み出さないと考えがちだ。

今回の訪問中、いくつかの学術色の強い研究所を訪れた際、多くの責任者が、より野心的な研究文化を育成しようとしていると語った。一方、私たちが話した技術責任者の中には、この科学研究の再構築が短期的に実現可能かどうか疑問視する者もいる。なぜなら、それは教育体系やインセンティブ体系の抜本的な再設計を必要とし、その改造は非常に大きく、現状の経済バランスの中では難しいからだ。

この文化は、非常に野心的な「大規模言語モデル構築ゲーム」に長けた学生やエンジニアを育てているようだ。もちろん、彼らの数も非常に豊富だ。

これらの学生たちは、中国でも米国と似た人材流出が起きていることを伝えてくれた。かつて学術の道を志した多くの人々が、今や産業界に留まることを選び始めている。最も面白いのは、もともと教授になりたかった研究者が、「教育に近づきたいから」と言っていたのに、その後、「大規模言語モデルによって教育は解決された」とコメントしたことだ——「学生はもう私と話す必要はない!」

新鮮な視点を持つ学生たちが大規模言語モデルの分野に入り込むことは、強みだ。過去数年、我々は大規模言語モデルの重要なパラダイムが絶えず変化してきたのを見てきた。MoEの拡張、強化学習の拡張、エージェントのサポートへと進化している。これらのいずれかをうまくやるには、膨大な背景情報を素早く吸収しなければならない。それは、より広範な文献だけでなく、所属企業の技術スタックも含む。

こうしたことに慣れ、謙虚な心で「何が効果的か」についての先入観を捨てて取り組む学生たちは、人生を投じてモデル改善の機会を追い求めている。

また、彼らは非常に率直で、科学者を悩ませる哲学的な議論にはあまり関わらない。AIの経済的影響や長期的な社会リスクについてどう考えるかと尋ねたとき、中国の研究者の中には複雑な見解を持ち、それらの議題に影響を与えようとする者は圧倒的に少ない。彼らは自分の役割は、最良のモデルを構築することだと考えている。

この差異は微妙であり、否定されやすいものだ。しかし、優雅で賢く、英語で明確に表現できる研究者と長時間対話すると、最も感じやすいのは、AIの哲学的な根本問題について質問したとき、その答えが空中に浮かび、彼らが示すのは単純な困惑だということだ。彼らにとって、それはカテゴリーの誤りである。

さらには、Dan Wangの有名な判断を引用した研究者もいる:米国は弁護士主導だが、中国はエンジニアが支配している、と。これらの問題について語るとき、彼はこの比喩を用いて、彼らが望む未来像を強調した。中国には、DwarkeshやLexのような超主流のポッドキャストのように、中国の科学者のスター的影響力を育てる体系的な道筋は存在しない。

私は中国の科学者に、AIが引き起こす未来の経済的不確実性や、単純なAGI能力を超える問題、あるいはモデルの倫理的な振る舞いについての議論を求めたが、彼らの成長背景や教育背景(編集済み1)を見ると、彼らは非常に仕事に集中しているが、社会のあり方や変革について議論や表現を奨励されてきた体系には育っていないことがわかる。

遠くから見ると、特に北京は、湾区のように感じられる。競争力のある研究所が、歩いて数分、あるいはタクシーで数分の距離にある。私が飛行機を降りてホテルへ向かう途中、阿里巴巴北京キャンパスに立ち寄った。次の36時間で、智谱AI、月之暗面、清華大学、メイトゥアン、小米、01.aiを訪問した。

中国では滴滴の移動が非常に便利だ。XL車種を選ぶと、マッサージチェア付きの電動ミニバンに頻繁に配車される。研究者に人材争奪戦について尋ねると、米国と非常に似ているとの答えだった。研究者の転職は普通であり、どこに行くかは、その時々の雰囲気次第だ。

中国の大規模言語モデルコミュニティは、むしろエコシステムのようであり、部族間の争いではない。多くの非公開の会話で聞かれるのは、ほぼ全てが同僚への敬意だ。すべての中国の研究所は、字节跳动とその流行の豆包モデルに警戒心を抱いている。これは中国唯一の最先端のクローズドソース研究所だからだ。一方、DeepSeekは、実行面で最も研究的な趣味を持つ研究所として尊敬されている。米国では、研究所のメンバーと非公開で交流すると、火花が散ることも少なくない。

中国の研究者の謙虚さの中で、最も印象的なのは、彼らが商業面でもしばしば肩をすくめ、「それは彼らの問題ではない」と言うことだ。一方、米国では、誰もがデータ販売、計算資源、資金調達といったエコシステムのトレンドに夢中になっている。

中国のAI産業と西側の研究所の違いと類似点

今日、AIモデルを構築することは、単に優秀な研究者を一つの建物に集めてエンジニアリングの奇跡を作ること以上の意味を持つ。過去は確かにそうだったが、AIビジネスを維持するために、大規模モデルはハイブリッドな存在になりつつある。構築、展開、資金調達、そしてその創造物の採用推進を含む。

トップクラスのAI企業は、複雑なエコシステムの中に存在している。これらのエコシステムは、資金、計算資源、データ、その他多くのリソースを提供し、最先端の進展を持続させている。

西側のエコシステムでは、大規模言語モデルの創造と維持に必要なさまざまな投入要素の統合方法は、すでにかなり明確に概念化され、図式化されている。AnthropicやOpenAIがその代表例だ。したがって、中国の研究所の思考方式に明らかな違いが見られるなら、それは将来の投資先の差異を示す可能性がある。もちろん、これらの未来も資金調達や計算資源の制約に大きく左右される。

私がこれらの研究所と交流して得た、最大の「AI産業レベル」の収穫を以下に整理する:

第一、中国のAI需要はすでに初期兆候を示している。
広く議論されている仮説は、中国のAI市場は小さくなるだろうというものだ。なぜなら、中国企業はソフトウェアに対してお金を払いたがらず、巨大な推論市場を生み出すことは永遠に不可能だと考えられているからだ。

しかし、この判断はSaaSエコシステムに対応したソフト支出に限った話だ。中国の歴史上、SaaSエコシステムは非常に小さかった。一方で、中国には依然として巨大なクラウド市場が存在している。

重要かつ未解決の問いは、中国企業のAI支出が、SaaS市場のように規模が小さいのか、それともクラウド市場のように基盤的な支出なのかだ。この問題は中国の研究所内部でも議論されている。全体として、AIはクラウド市場に近づいていると感じており、新しいツールを巡る市場の成長に懸念は見られない。

第二、多くの開発者はClaudeの影響を深く受けている。
Claudeは名目上中国では禁じられているが、中国の多くのAI開発者はClaudeに夢中であり、それがソフトウェア構築の方法を変えたことに非常に関心を持っている。過去に中国がソフトウェア購入に消極的だったことだけで、中国に巨大な推論需要の波が来ないとは考えにくい。

中国の技術者は非常に実用的で謙虚、かつ意欲的だ。これは、過去の「お金を払わずにソフトを買う」歴史的習慣よりも強く感じられる。

一部の中国研究者は、自分たちのツール(例:KimiやGLMのコマンドラインツール)を使って構築していると述べるが、皆Claudeの使用を挙げる。意外だったのは、Codexについてはほとんど触れられず、Codexは湾区では急速に普及していることだ。

第三、中国企業は技術的所有権意識を持つ。
中国文化は、轟く経済エンジンと結びつき、予測不能な結果を生み出している。私が深く感じたのは、多数のAIモデルが、ここにある多くの技術企業の現実的なバランスを反映していることだ。全体の計画は存在しない。

この産業は、字节跳动や阿里巴巴への尊敬によって定義されている。これらは、強力な資源を持ち、多くの市場を勝ち取ると考えられる巨大な既得権益者だ。DeepSeekは尊敬される技術リーダーだが、市場のリーダーではない。方向性は示すが、市場で勝つ構造は持ち合わせていない。

その結果、MeituanやAnt Groupのような企業が残る。西洋人はなぜ彼らもこれらのモデルを構築しているのか驚くかもしれないが、実際には、彼らは大規模言語モデルを未来の技術製品の核心と見なしており、強力な基盤を必要としている。

これらの企業が強力な汎用モデルを微調整するとき、オープンソースコミュニティからのフィードバックは、彼らの技術スタックをより堅牢にし、内部微調整版を保持できる。こうした「オープン優先」の心構えは、実用主義に由来し、モデルのフィードバックを得て、オープンソースに還元し、自社の使命を支えることに役立つ。

第四、政府の支援は実在するが、その規模は不明確。
中国政府がオープン大規模言語モデルの競争を積極的に支援しているとよく言われるが、これは多層的で比較的非中央集権的な政府体系の中の話であり、それぞれの層には明確な操作マニュアルは存在しない。

北京の異なる地区は競争し、テック企業にオフィスを置かせようとする。これらの企業への「支援」には、官僚的な手続きの簡素化や許認可の緩和が含まれることはほぼ確実だが、その範囲はどこまでか?政府の異なる層は人材誘致に役立つのか?チップの密輸に協力できるのか?

訪問中、多くの政府の関心や支援に関する言及があったが、詳細を断言できるほどの情報はなく、また、政府が中国のAI発展の軌跡にどう影響を与えるかについての確信も持てない。

もちろん、中国政府の最高層が技術的な意思決定に影響を与えている兆候もない。

第五、データ産業は西側ほど発達していない。
以前から、AnthropicやOpenAIは、単一の環境に1,000万ドル以上を費やし、強化学習の最先端を推進するために年間数億ドルの支出をしていると聞いている。中国の研究所も、米国企業から同じ環境を購入しているのか、あるいは国内のエコシステムが支えているのか気になるところだ。

答えは、「データ産業が全くない」わけではなく、むしろ、彼らの経験から言えば、データ産業の質は相対的に低いため、多くの場合は内部で環境やデータを自作した方が良いと考えている。研究者は自ら時間をかけて強化学習の訓練環境を作り、字节跳动や阿里巴巴などの大企業は内部のデータアノテーションチームを持ち、それを支援している。これらは、「自前で作る」心構えを反映している。

第六、NVIDIAのチップへの渇望は非常に強い。
NVIDIAの計算能力は訓練の黄金標準であり、進展はより多くの計算資源を必要とする。供給が十分なら、当然購入する。Huaweiをはじめとする他のアクセラレータも推論において高く評価されている。多くの研究所がHuaweiのチップを使用できる。

これらのポイントは、非常に異なるAIエコシステムを描いている。西側の研究所の運営方式を中国の同業者にそのまま当てはめると、誤ったカテゴリーに陥ることが多い。重要なのは、これらの異なるエコシステムが、実質的に異なるタイプのモデルを生み出すのか、それとも中国のモデルは、3〜9ヶ月前の米国の最先端モデルとほぼ同じ解釈をされ続けるのか、という点だ。

結論:世界的なバランス

この旅の前、私は中国についてほとんど知らなかった。出発時、私は学び始めたばかりだと感じている。中国はルールやレシピで表現できる場所ではなく、非常に異なる動力メカニズムと化学反応を持つ場所だ。その文化は古く、深く、国内の技術構築のあり方と完全に絡み合っている。私にはまだ多くを学ぶ必要がある。

米国の現権力構造の多くは、彼らの既存の中国観を意思決定の重要な心理ツールとして用いている。私が中国のほぼすべての主要なAI研究所と正式または非公式に対面した結果、彼らには、西洋の意思決定方式ではモデル化しにくい多くの資質と本能があることに気づいた。

たとえ、これらの研究所に、最も強力なモデルを公開させる理由を尋ねても、「所有権意識」と「エコシステム支援」の交差点を完全に結びつけることは難しい。

これらの研究所は非常に実用的であり、必ずしもオープンソースの絶対主義者ではない。すべてのモデルが公開されるわけではないが、開発者支援やエコシステム支援、そしてオープンを自らのモデル理解の一手段とする意図は深い。

ほぼすべての中国の大手テック企業は、自社の汎用大規模言語モデルを構築している。私たちはすでに、Meituanのようなプラットフォーム型サービス企業や、Xiaomiのような大規模消費者テック企業が、オープンな重みを持つモデルをリリースしているのを見ている。米国の同類企業は、通常サービスの購入にとどまる。

これらの企業は、流行の新技術のために存在感を示すためではなく、深層かつ根本的な願望——自らの技術スタックをコントロールし、最も重要な技術を発展させるためにモデルを構築している。ノートパソコンの画面から目を離すと、地平線上にクレーンの群れが見えるが、これは中国のより広範な建設文化とエネルギーと一致している。

中国の研究者の人情味、魅力、誠実さは、非常に親近感を覚える。個人レベルでは、米国で慣れ親しんだ厳しい地政学的議論は、彼らには全く浸透していない。この世界には、もっとこうしたシンプルな積極性があっても良い。AIコミュニティの一員として、今私が最も気にしているのは、国籍のタグを巡るメンバーやグループ間の裂け目だ。

もし私が、「米国の研究所がAI技術スタックのすべての部分で明確なリーダーになることを望まない」と言えば、それは嘘になる。特に、私が多くの時間を費やしてきたオープンモデルの分野では、私は米国人であり、それが正直な好みだ。

一方、私はオープンエコシステムが世界的に繁栄し続けることを願っている。そうすれば、より安全でアクセスしやすく、役に立つAIが世界に生まれるからだ。今の問題は、米国の研究所が行動を起こし、このリーダーシップを握るかどうかだ。

この記事を書き終える頃、行政命令によるオープンモデルへの影響に関する噂が流れている。これが、米国のリーダーシップとグローバルエコシステムの協調関係をさらに複雑にする可能性もあり、私の自信を揺るがしている。

最後に、月之暗面、智谱AI、メイトゥアン、小米、通义千問、蚂蚁灵光、01.ai、その他多くの機関の皆さんと交流できたことに感謝したい。皆さんは皆、非常に熱心で、惜しみなく時間を割いてくれた。私の考えが少しずつまとまりつつある今、引き続き中国の観察結果を共有していきたい。文化的側面も含め、AI分野そのものも。

これらの知見は、AIの最前線の進展と密接に関係していることは明らかだ。

原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
コメントを追加
コメントを追加
コメントなし
  • ピン