CAISIは、NISTの単位であり、5月1日に発表された評価でDeepSeek V4 Proが米国の最前線から約8か月遅れていると述べた。CAISIは、非公開のデータセットを含む9つのベンチマークで項目反応理論を使用したが、これにより結果の再現が不可能になっている。スタンフォードの2026年AI指数は、公開リーダーボードにおける米中の差が2.7%に縮小したと述べた。
CAISIはDeepSeek V4 Proが米国フロンティアより約8ヶ月遅れていると述べる
CAISIは、NISTの単位であり、5月1日に発表された評価でDeepSeek V4 Proが米国の最前線から約8か月遅れていると述べた。CAISIは、非公開のデータセットを含む9つのベンチマークで項目反応理論を使用したが、これにより結果の再現が不可能になっている。スタンフォードの2026年AI指数は、公開リーダーボードにおける米中の差が2.7%に縮小したと述べた。