Дешевле в 20 раз, производительность снизилась всего на 8%! Gemini 3.2 Flash следующей неделе выпустит I/O, напрямую конкурируя с GPT-5.5

robot
Генерация тезисов в процессе

AIMPACT сообщение, 14 мая (UTC+8), согласно мониторингу Beating от Датчата, Google планирует представить новое поколение легких моделей Gemini 3.2 Flash на конференции I/O 20 мая, общая производительность модели примерно на уровне GPT-5.5, но явно уступает Mythos от Anthropic. Генеральный директор Abacus.AI Бинду Редди сообщил, что по слухам Gemini 3.2 Flash достигла 92% от GPT-5.5 в задачах кодирования и рассуждений, при этом затраты на рассуждения составляют всего пятнадцать или двадцать процентов от последних, а задержка большинства запросов ниже 200 миллисекунд. Она считает, что технологии дистилляции и разрежения Google играют огромную роль, по сути сжимая передовую модель до уровня Flash, при этом не наблюдается обычного снижения производительности. Ранее были признаки утечек Gemini 3.2 Flash. В начале мая кто-то обнаружил следы этой модели в сборке iOS-приложения и метаданных AI Studio, а затем она появилась анонимно в оценках LM Arena. Ранние тестировщики отметили, что эта модель показывает выдающиеся результаты в креативных задачах кодирования, даже превосходя Gemini 3.1 Pro в некоторых бенчмарках. (Источник: BlockBeats)

Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Закреплено