据动察 Beating 监测,谷歌云控制台的模型筛选列表中出现名为 gemini-3.2-flash-lite-live-preview 的基础模型选项。 これは今月初めに iOS アプリのビルドパッケージと AI Studio で露出した痕跡に続き、公式プラットフォームで再び露出されたこのシリーズのモデルです。 新しいオプションには lite と live の接尾辞が付いており、Google が超低遅延のリアルタイムインタラクション向けに特化したバージョンを切り分けていることを示しています。 Abacus.AI のCEO Bindu Reddy は以前、Gemini 3.2 Flash のエンコードと推論能力が GPT-5.5 の92%に達していると明らかにしましたが、蒸留と疎化技術のおかげで推論コストは後者の20分の1に抑えられ、多くのクエリの遅延は200ミリ秒以下です。 クラウドインターフェースの先行リリースに伴い、業界ではこの極致のコストパフォーマンスを実現する軽量モデルが5月20日のGoogle I/Oで正式に発表されると予想されています。
推理コストはわずかGPT-5.5の二十分の一、Gemini 3.2リアルタイムモデルがGoogle Cloudに登場
据动察 Beating 监测,谷歌云控制台的模型筛选列表中出现名为 gemini-3.2-flash-lite-live-preview 的基础模型选项。
これは今月初めに iOS アプリのビルドパッケージと AI Studio で露出した痕跡に続き、公式プラットフォームで再び露出されたこのシリーズのモデルです。
新しいオプションには lite と live の接尾辞が付いており、Google が超低遅延のリアルタイムインタラクション向けに特化したバージョンを切り分けていることを示しています。
Abacus.AI のCEO Bindu Reddy は以前、Gemini 3.2 Flash のエンコードと推論能力が GPT-5.5 の92%に達していると明らかにしましたが、蒸留と疎化技術のおかげで推論コストは後者の20分の1に抑えられ、多くのクエリの遅延は200ミリ秒以下です。
クラウドインターフェースの先行リリースに伴い、業界ではこの極致のコストパフォーマンスを実現する軽量モデルが5月20日のGoogle I/Oで正式に発表されると予想されています。