Дешевше в 20 раз, продуктивність знизилася лише на 8%! Gemini 3.2 Flash наступного тижня випустить I/O, безпосередньо порівнюючи з GPT-5.5

robot
Генерація анотацій у процесі

AIMPACT повідомлення, 14 травня (UTC+8), згідно з моніторингом Beating, Google планує випустити нову легку модель Gemini 3.2 Flash на конференції I/O 20 травня, загальна продуктивність моделі приблизно на рівні GPT-5.5, але явно поступається Mythos від Anthropic. CEO Abacus.AI Бінду Редді повідомила, що чутки стверджують, що Gemini 3.2 Flash досягла 92% від GPT-5.5 у завданнях кодування та розуміння, при цьому вартість розрахунків становить лише п’ятнадцять або двадцять разів менше, ніж у останнього, а затримка більшості запитів менше 200 мілісекунд. Вона вважає, що технології дистиляції та розрідження Google відіграють важливу роль, фактично стискаючи передову модель до рівня Flash без звичайного падіння продуктивності. Раніше були ознаки витоку Gemini 3.2 Flash. На початку травня хтось виявив сліди цієї моделі у пакеті побудови iOS-додатків та метаданих AI Studio, а згодом вона з’явилася анонімно у тестах LM Arena. Перші користувачі повідомили, що ця модель показує високі результати у творчих завданнях кодування, навіть перевершуючи Gemini 3.1 Pro у деяких бенчмарках. (Джерело: BlockBeats)

Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріплено