Gemini 3.1 Flash-Lite офіційно випущено: ціна введення лише чверть від Claude 4.5 Haiku, GPQA на понад 14 відсотків вище

Згідно з моніторингом Beating, Google Gemini 3.1 Flash-Lite перейшов від попереднього перегляду у березні до офіційної версії (GA), це найдешевша та найшвидша модель у серії Gemini 3, яка вже готова до висококонкурентного виробничого середовища. Модель оснащена стандартним режимом thinking з чотирма рівнями контролю інтелектуальної навантаженості (мінімальний, низький, середній, високий), користувачі можуть регулювати швидкість і якість залежно від сценарію.

Ціни залишаються на рівні попереднього перегляду: 0,25 долара США за мільйон токенів для введення та 1,50 долара за мільйон токенів для виведення. У порівнянні з конкурентами того ж рівня, ціна за введення становить чверть від Claude 4.5 Haiku (0,25 проти 1,00 долара), ціна за виведення менше третини (1,50 проти 5,00 долара); дешевше за попередню генерацію 2.5 Flash, де ціна за введення знизилася з 0,30 до 0,25, а за виведення — з 2,50 до 1,50. Контекстне вікно — 1 мільйон токенів.

Показники продуктивності між рівнями: GPQA Diamond (наукове мислення для аспірантів) 86,9%, що перевищує Claude 4.5 Haiku з 73,0% та GPT-5 mini з 82,3%; MMMU-Pro (мульти-модальне розуміння та мислення) 76,8%, також випереджає конкурентів того ж рівня. Швидкість виведення — 363 токени/с, що на 45% швидше за 2.5 Flash, а час відповіді на перший токен — у 2,5 рази швидше. Рейтинг Elo на платформі Arena.ai становить 1432.

Багато компаній вже використовують її у виробничому середовищі. Платформа обслуговування клієнтів Gladly використовує Flash-Lite для управління текстовими каналами AI-агентів, обробляючи щотижня мільйони взаємодій з клієнтами, при цьому вартість на 60% нижча за рівень моделей з аналогічним рівнем інтелекту, p95 затримка — близько 1,8 секунди, рівень успішних операцій — 99,6%. JetBrains використовує її для управління IDE AI-помічником та агентом Junie. Фінансова платформа Ramp застосовує її для сценаріїв з високою частотою та чутливістю до затримок.

Програмування — слабка сторона Flash-Lite, LiveCodeBench має 72,0%, що поступається GPT-5 mini з 80,4%.

Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріпити