動態監測 Beating による監視によると、前字節跳動の Seed チームのエンジニアであり、現在北京大学の助理教授である張驰は、ポッドキャスト「Into Asia」の中で、字節跳動が大規模モデルの訓練(事前訓練と後訓練)を完了するのに約半年かかると明らかにした。一方、Googleは噂によるとわずか3ヶ月で済むという。彼は、イテレーションの速度が中国企業が追いつくのが難しい主な理由の一つだと考えている。張驰は字節跳動に約1年在籍し、数学チームは研究志向が強いと述べており、自身のグループの位置付けは「より宣伝のためのものだ」とし、モデルのデリバリーを担当する事前訓練と後訓練のチームとは異なると語った。張驰は、Seed内部のbenchmaxxing(スコアの刷り込み)文化について説明した:チームリーダーは担当するベンチマークに基づいてパフォーマンスを評価し、全員がスコアを競っているが、「これは実際の使用時の良い体験に変わるわけではない」と述べた。彼は、紙面上では中国の大手企業のモデルは米国の最先端モデルに追いついているとされているが、実際に使うと「十分良くない」と指摘した。Seedの目標は世界トップクラスだが、「残念ながら、追いついたとは思わない」とし、国内第一を目指すことさえ「実現していない」と語った。2024年末までにSeedはGPT-4oに追いついたと自己評価し、その後DeepSeekがリリースされたが、チームは依然として差があることを認識し、彼が参加したときには全員が緊急に強化学習に切り替えていた。
前字节Seedエンジニア:バイトの一回のイテレーションは半年、グーグルの噂ではわずか三ヶ月
動態監測 Beating による監視によると、前字節跳動の Seed チームのエンジニアであり、現在北京大学の助理教授である張驰は、ポッドキャスト「Into Asia」の中で、字節跳動が大規模モデルの訓練(事前訓練と後訓練)を完了するのに約半年かかると明らかにした。一方、Googleは噂によるとわずか3ヶ月で済むという。彼は、イテレーションの速度が中国企業が追いつくのが難しい主な理由の一つだと考えている。張驰は字節跳動に約1年在籍し、数学チームは研究志向が強いと述べており、自身のグループの位置付けは「より宣伝のためのものだ」とし、モデルのデリバリーを担当する事前訓練と後訓練のチームとは異なると語った。
張驰は、Seed内部のbenchmaxxing(スコアの刷り込み)文化について説明した:チームリーダーは担当するベンチマークに基づいてパフォーマンスを評価し、全員がスコアを競っているが、「これは実際の使用時の良い体験に変わるわけではない」と述べた。彼は、紙面上では中国の大手企業のモデルは米国の最先端モデルに追いついているとされているが、実際に使うと「十分良くない」と指摘した。Seedの目標は世界トップクラスだが、「残念ながら、追いついたとは思わない」とし、国内第一を目指すことさえ「実現していない」と語った。2024年末までにSeedはGPT-4oに追いついたと自己評価し、その後DeepSeekがリリースされたが、チームは依然として差があることを認識し、彼が参加したときには全員が緊急に強化学習に切り替えていた。