AIMPACT メッセージ、5 月 14 日(UTC+8)、動察 Beating 監測によると、Google は 5 月 20 日の I/O 大会で新世代の軽量モデル Gemini 3.2 Flash を発表する予定であり、モデルの全体的な性能は GPT-5.5 とほぼ同等だが、明確に Anthropic の Mythos には及ばない。 Abacus.AI の CEO Bindu Reddy は、噂によると、Gemini 3.2 Flash はコーディングと推論タスクで GPT-5.5 の 92% に達し、推論コストは後者の 15 分の 1 から 20 分の 1 であり、ほとんどのクエリの遅延は 200 ミリ秒未満だと明かした。彼女は、Google の蒸留と疎化技術が大きな役割を果たしていると考えており、これは本質的に最先端のモデルを Flash レベルに圧縮したものであり、通常の性能の崖は見られないと述べている。 Gemini 3.2 Flash には以前から漏洩の兆候があった。5 月初め、iOS アプリのビルドパッケージと AI Studio のメタデータの中でこのモデルの痕跡が見つかり、その後、匿名の状態で LM Arena の評価に登場した。初期のテスターからは、このモデルは創造的なコーディングタスクで優れたパフォーマンスを示し、一部のベンチマークでは Gemini 3.1 Pro を超えることさえあったとのフィードバックがある。(出典:BlockBeats)
安価で20倍の性能向上、ただし性能低下はわずか8%!
Gemini 3.2 Flashの次週I/Oリリース、直接GPT-5.5に対抗
AIMPACT メッセージ、5 月 14 日(UTC+8)、動察 Beating 監測によると、Google は 5 月 20 日の I/O 大会で新世代の軽量モデル Gemini 3.2 Flash を発表する予定であり、モデルの全体的な性能は GPT-5.5 とほぼ同等だが、明確に Anthropic の Mythos には及ばない。 Abacus.AI の CEO Bindu Reddy は、噂によると、Gemini 3.2 Flash はコーディングと推論タスクで GPT-5.5 の 92% に達し、推論コストは後者の 15 分の 1 から 20 分の 1 であり、ほとんどのクエリの遅延は 200 ミリ秒未満だと明かした。彼女は、Google の蒸留と疎化技術が大きな役割を果たしていると考えており、これは本質的に最先端のモデルを Flash レベルに圧縮したものであり、通常の性能の崖は見られないと述べている。 Gemini 3.2 Flash には以前から漏洩の兆候があった。5 月初め、iOS アプリのビルドパッケージと AI Studio のメタデータの中でこのモデルの痕跡が見つかり、その後、匿名の状態で LM Arena の評価に登場した。初期のテスターからは、このモデルは創造的なコーディングタスクで優れたパフォーマンスを示し、一部のベンチマークでは Gemini 3.1 Pro を超えることさえあったとのフィードバックがある。(出典:BlockBeats)