Techub News のニュースによると、Decrypt の報道によると、アメリカの NIST の下部機関 CAISI が発表した評価報告書によると、DeepSeek V4 Pro はアメリカの最先端 AI モデルより約8ヶ月遅れている。
この機関は IRT 評価システムを採用し、九つのベンチマークテストに基づいて評価を行い、そのうち二つは非公開データセットを使用している。 この評価は専門家の疑問を引き起こした。 Stanford 2026 AI Index は、中米の AI 性能差がすでに2.7%に縮小していることを示しており、また DeepSeek は公開ベンチマークテストでアメリカのトップモデルに近いパフォーマンスを示している。 さらに、コスト比較では、多くのアメリカのモデルを除外し、GPT-5.4 mini のみを比較対象としている。
Techub News のニュースによると、Decrypt の報道によると、アメリカの NIST の下部機関 CAISI が発表した評価報告書によると、DeepSeek V4 Pro はアメリカの最先端 AI モデルより約8ヶ月遅れている。
この機関は IRT 評価システムを採用し、九つのベンチマークテストに基づいて評価を行い、そのうち二つは非公開データセットを使用している。
この評価は専門家の疑問を引き起こした。
Stanford 2026 AI Index は、中米の AI 性能差がすでに2.7%に縮小していることを示しており、また DeepSeek は公開ベンチマークテストでアメリカのトップモデルに近いパフォーマンスを示している。
さらに、コスト比較では、多くのアメリカのモデルを除外し、GPT-5.4 mini のみを比較対象としている。