推理コストはわずかGPT-5.5の二十分の一、Gemini 3.2リアルタイムモデルがGoogle Cloudに登場

robot
概要作成中

据动察 Beating 监测,谷歌云控制台的模型筛选列表中出现名为 gemini-3.2-flash-lite-live-preview 的基础模型选项。
これは今月初めに iOS アプリのビルドパッケージと AI Studio で露出した痕跡に続き、公式プラットフォームで再び露出されたこのシリーズのモデルです。
新しいオプションには lite と live の接尾辞が付いており、Google が超低遅延のリアルタイムインタラクション向けに特化したバージョンを切り分けていることを示しています。
Abacus.AI のCEO Bindu Reddy は以前、Gemini 3.2 Flash のエンコードと推論能力が GPT-5.5 の92%に達していると明らかにしましたが、蒸留と疎化技術のおかげで推論コストは後者の20分の1に抑えられ、多くのクエリの遅延は200ミリ秒以下です。
クラウドインターフェースの先行リリースに伴い、業界ではこの極致のコストパフォーマンスを実現する軽量モデルが5月20日のGoogle I/Oで正式に発表されると予想されています。

原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
コメントを追加
コメントを追加
コメントなし
  • ピン留め