ドンチャ・ビーティングの監視によると、張弛は同じインタビューで中国と米国のAIギャップについて直接評価を行った:「中国が追いついているという考えには同意しない。私はまだ大きく遅れていると信じている。ギャップは拡大しており、非常に残念だ。」彼の同僚や学生は概ね同意しているが、彼はまた、ZhipuやMiniMaxのような上場企業のリーダーシップはこの評価に同意しないだろうとも認めている。彼はその理由を三つの側面に帰している。第一に、蒸留のショートカット:彼は多くの中国企業が直接Claude、GPT、またはGeminiの出力をトレーニングデータとして使用していると考えており、「Claudeは最近、多くの蒸留試行を検出していると述べている。おそらくそれが一部の企業がショートカットを取っている方法だろう」と述べている。しかし、彼はまた、DeepSeekがV3とR1で実際のアーキテクチャの革新を示したことも認めている。第二に、ユーザーフィードバックループの欠如:米国のモデルはユーザーフレンドリーであり、より多くのユーザーを引き付け、ユーザーフィードバックがモデルの改善につながる。一方、中国のモデルは最初から十分でなく、ユーザーが少なく、データも限られ、悪循環を生んでいる。第三に、インフラのギャップ:彼はGoogleでのインターンシップ中のインフラは「非常に優れており、コードが非常にスムーズに動作していた」と感じており、これはByteDanceと比べて大きな違いだと述べている。
元バイトダンスエンジニア:中国と米国のAIギャップが拡大しており、蒸留のショートカットとフィードバックループの欠如が主な原因
ドンチャ・ビーティングの監視によると、張弛は同じインタビューで中国と米国のAIギャップについて直接評価を行った:「中国が追いついているという考えには同意しない。私はまだ大きく遅れていると信じている。ギャップは拡大しており、非常に残念だ。」彼の同僚や学生は概ね同意しているが、彼はまた、ZhipuやMiniMaxのような上場企業のリーダーシップはこの評価に同意しないだろうとも認めている。彼はその理由を三つの側面に帰している。第一に、蒸留のショートカット:彼は多くの中国企業が直接Claude、GPT、またはGeminiの出力をトレーニングデータとして使用していると考えており、「Claudeは最近、多くの蒸留試行を検出していると述べている。おそらくそれが一部の企業がショートカットを取っている方法だろう」と述べている。しかし、彼はまた、DeepSeekがV3とR1で実際のアーキテクチャの革新を示したことも認めている。第二に、ユーザーフィードバックループの欠如:米国のモデルはユーザーフレンドリーであり、より多くのユーザーを引き付け、ユーザーフィードバックがモデルの改善につながる。一方、中国のモデルは最初から十分でなく、ユーザーが少なく、データも限られ、悪循環を生んでいる。第三に、インフラのギャップ:彼はGoogleでのインターンシップ中のインフラは「非常に優れており、コードが非常にスムーズに動作していた」と感じており、これはByteDanceと比べて大きな違いだと述べている。