Google Gemma 4が正式リリース:4つのサイズが初登場、Apache 2.0ライセンス、31Bのグローバルオープンソース第3位

robot
概要作成中

1M AI News のモニタリングによると、Google はオープンソースのモデルファミリー Gemma 4 を正式にリリースしました。4 つの異なるサイズを含み、すべて Apache 2.0 ライセンスを採用しています。Google は、これはコミュニティからのフィードバックへの対応だと述べています。Apache 2.0 であれば、開発者は追加の制約なしに自由に商用利用、改変、再配布できます。Hugging Face の共同創始者兼 CEO である Clément Delangue は、この取り組みを「巨大なマイルストーン」と称しました。

4 つのモデルは異なるハードウェアのシーンに対応しています:

  1. 31B Dense:最高の元の品質で、微調整に適しています。未量子化の重みは単一の 80GB H100 で動作可能で、量子化版はコンシューマー向け GPU に対応します
  2. 26B MoE(混合エキスパート):総パラメータは 26B ですが、推論時に有効化されるのは 3.8B のみで、低遅延を主にし、速度に敏感な Agent のシーンに適しています
  3. E4B と E2B:スマホや IoT デバイス向けのエッジモデルで、推論時にそれぞれ約 4B と 2B のパラメータを有効化するだけでデバイスの稼働時間を維持でき、音声入力(音声認識と理解)をネイティブにサポートし、完全にオフラインで動作可能です

大規模モデルの匿名対戦評価プラットフォーム Arena AI のテキストランキングでは、31B は世界のオープンソースモデルで 3 位、26B は 6 位です。Google は「体量を 20 倍上回るモデル」を超えていると述べています。モデルは Gemini 3 と同じ研究および技術に基づいて構築されています。

コア機能には、多段推論と計画、ネイティブな関数呼び出し、JSON の構造化出力(Agent ワークフロー向け)、コード生成、画像および動画の理解(全シリーズ)、ネイティブな 140 以上の言語での学習が含まれます。エッジモデルは 128K のコンテキストウィンドウをサポートし、大規模モデルは最大 256K をサポートします。E2B と E4B は Google Pixel チーム、高通、MediaTek と共同で最適化されており、スマホ、Raspberry Pi、NVIDIA Jetson Orin Nano などのデバイスで動作可能です。Android 開発者は AICore Developer Preview のプロトタイプを通じて Agent アプリを構築でき、今後の Gemini Nano 4 に向けた互換性の準備を行えます。

エコシステム面では初日から Hugging Face、vLLM、llama.cpp、MLX、Ollama、NVIDIA NIM、LM Studio、Unsloth などの主要フレームワークに対応しており、Google AI Studio(31B と 26B)および AI Edge Gallery(E4B と E2B)でそのまま体験できます。初代のリリース以来、Gemma シリーズは 4 億回以上ダウンロードされており、コミュニティ派生は 10 万以上のバリエーションにのぼります。

原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
コメントを追加
コメントを追加
コメントなし
  • ピン