Вартість розуміння становить лише одну двадцяту від GPT-5.5, модель Gemini 3.2 у реальному часі з'явилася на Google Cloud

robot
Генерація анотацій у процесі

Згідно з моніторингом Beating, у списку фільтрів моделей консолі Google Cloud з’явилася базова модель під назвою gemini-3.2-flash-lite-live-preview. Це повторне з’явлення цієї серії моделей на офіційній платформі після того, як на початку місяця були виявлені сліди у пакеті побудови iOS-додатків та AI Studio. Новий варіант має суфікси lite та live, що свідчить про те, що Google розділяє спеціалізовані версії для дуже низької затримки у реальному часі. Генеральний директор Abacus.AI Бінду Редді раніше повідомила, що кодування та здатність до виведення Gemini 3.2 Flash досягають 92% від GPT-5.5, але завдяки технологіям дистиляції та розрідження, вартість виведення становить лише одну двадцяту від останнього, а затримка більшості запитів — менше 200 мілісекунд. З урахуванням попереднього запуску інтерфейсу у хмарі, галузь очікує, що ця легка модель з максимальною співвідношенням ціна-якість буде офіційно представлена на конференції Google I/O 20 травня.

Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріплено