Google Gemma 4 офіційно випущено: 4 розміри вперше під ліцензією Apache 2.0, 31B — третя у світі відкритий код

robot
Генерація анотацій у процесі

За моніторингом 1M AI News, Google офіційно випустила відкриту сімейство моделей Gemma 4, яке включає 4 варіанти різних розмірів, і всі вони використовують ліцензію Apache 2.0. Google заявляє, що це відповідь на відгуки спільноти. Apache 2.0 означає, що розробники можуть вільно використовувати для комерції, модифікувати та розповсюджувати без додаткових обмежень. Співзасновник і CEO Hugging Face Clément Delangue назвав цей крок «великим етапом».

4 моделі орієнтовані на різні сценарії апаратного забезпечення:

  1. 31B Dense: найвища первинна якість, підходить для файнтюнінгу; не квантовані ваги можна запускати на одній 80GB H100, а квантовані версії підтримують GPU споживчого класу
  2. 26B MoE (мікроексперти/мікс експертів): загалом 26B параметрів, але під час інференсу активується лише 3.8B; головний акцент — низька затримка, підходить для Agent-сценаріїв, де важлива швидкість
  3. E4B і E2B: крайові моделі для смартфонів і IoT-пристроїв; під час інференсу відповідно активуються близько 4B і 2B параметрів, чого достатньо, щоб зберегти автономність пристрою; нативно підтримують аудіовхід (розпізнавання та розуміння мовлення) і можуть працювати повністю офлайн

У текстовому рейтингу на анонімній платформі бенчмарків великих моделей Arena AI 31B посідає третє місце серед глобальних відкритих моделей, а 26B — шосте; Google називає це «моделлю, яка перевершує за обсягом у 20 разів». Моделі побудовані на тих самих дослідженнях і технологіях, що й Gemini 3.

Ключові можливості включають багатокрокове міркування та планування, нативні виклики функцій і JSON-структуровані виводи (для Agent-робочих процесів), генерацію коду, розуміння зображень і відео (вся лінійка), нативне навчання понад 140 мов. Крайові моделі підтримують контекстне вікно 128K, а великі моделі — до 256K. E2B і E4B разом оптимізовані з командою Google Pixel, Qualcomm і MediaTek, тож їх можна запускати на смартфонах, Raspberry Pi, NVIDIA Jetson Orin Nano тощо; розробники Android можуть через прототип AICore Developer Preview збирати Agent-додатки, готуючи сумісність для майбутніх Gemini Nano 4.

Щодо екосистеми, вже в перший день доступна підтримка таких популярних фреймворків, як Hugging Face, vLLM, llama.cpp, MLX, Ollama, NVIDIA NIM, LM Studio, Unsloth тощо; можна безпосередньо випробувати в Google AI Studio (31B і 26B) та AI Edge Gallery (E4B і E2B). Від моменту випуску першої версії серію Gemma завантажили понад 400 мільйонів разів, а спільнотні похідні налічують понад 100 тисяч варіантів.

Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріпити