2026-06-21 16:11:46
Inception LabsのMercury 2はAIME 2026で90%を達成し、GoogleのDiffusionGemmaを上回りました
木曜日(6月18日)、Inception LabsはMercury 2を発表し、これを世界最速の推論言語モデルだと主張しました。毎秒約1,000トークンを生成するとされています。同社の発表によれば、Mercury 2は同じベンチマークでGoogleのDiffusionGemmaが69.1%だったのに対し、AIME 2026(American Invitational Mathematics Examinationの問題)で90%のスコアを記録しました。さらにこのモデルは、PhDレベルの科学ベンチマークであるGPQAで77%も達成しています。AIコーディングエージェント企業のAugment Codeは、Mercury 2をAnthropicのClaude Opus 4.7に置き換えた後、レイテンシーが82%減少し、コストも90%削減され、出力品質は維持されたと報告しました。