Тільки що Гугл кинув чергову бомбу - 19 лютого випустили Gemini 3.1 Pro, і це не просто косметичне оновлення. Чесно, навіть я був здивований, коли побачив, що вони пропустили версію 3.0 і одразу перейшли на 3.1. Зазвичай Google йде за схемою 1.0 - 1.5 - 2.0 - 2.5 - 3.0, але тут щось інше.



Головна фішка - це не збільшення можливостей, а справжній апгрейд мозків моделі. Вони вбудували технологію глибокого мислення прямо в основу, тож тепер модель може обдумувати задачу з різних сторін одночасно і обирати найкращий варіант. Раніше це була окрема опція для підписників, тепер це стандарт.

Що мені реально сподобалося при тестуванні? Модель зрозуміла неочевидну логічну помилку в коді, яку багато програмістів просто пропустили б. Написала оптимальний SQL-запит з правильними індексами, пояснила парадокс Монті Холла так, що навіть гуманітарій розбереться. Це не просто видача фактів - це справжнє розмірковування.

За бенчмарками цифри вражають:
- ARC-AGI-2 (тест на логіку): 77.1% проти 31.1% у попередньої версії. Це у два з половиною рази вище.
- Humanity's Last Exam: 44.4% - вище, ніж у GPT-5.2 (34.5%)

Але не тільки цифри. Демки, які виклали, просто вогонь. Модель розібралася в атмосфері роману "Грозовий перевал" і згенерувала сайт-портфоліо, який реально передає похмуре настроєння книги. Створила інтерактивну 3D-симуляцію зграї птахів, де можна впливати на траєкторію рукою. Підключилася до API МКС і побудувала реальний аерокосмічний дашборд. Це не просто генерація коду - це розуміння контексту і творчість.

Мультимодальність залишилася на рівні флагмана: текст, зображення, відео, аудіо, PDF. Контекстне вікно все ті ж мільйон токенів (приблизно як завантажити "Війну і мир" цілком), але максимальний вивід виріс до 64-65 тисяч токенів. Це ціла невелика книга за один запит.

Але ось де спільнота знайшла слабкі місця - це офісні задачі. У тесті GDPval-AA (презентації, таблиці, документи) Gemini набрав 1317, а Claude Sonnet 4.6 - 1633. У рейтингах, де люди голосують за симпатичні відповіді, Claude все ще попереду. Тож для складного коду - Gemini топ, для гарних презентацій - краще Claude.

А тепер найсмачніше - ціна. Google її не підняв. Вхід за мільйон токенів - 2 долари (якщо контекст до 200K) або 4 долари (якщо більше). Вихід - 12 або 18 доларів. Для порівняння: Claude Sonnet 4.6 просить 3 за вхід і 15 за вихід, GPT-5.2 це 10 і 30, а Claude Opus 4.6 - це взагалі 15 і 75.

На практиці: якщо потрібно обробити 100K вхідних і 10K вихідних токенів:
- Gemini: 32 цента
- Claude Sonnet: 45 центів
- GPT-5.2: 1.30 долара
- Claude Opus: 2.25 долара

Gemini виходить у 7 разів дешевше Opus. Для production-навантажень різниця відчутна.

Artificial Analysis провела тест: пропустили всі топ-моделі через свій Intelligence Index. Gemini потребувало 56 мільйонів токенів і коштувало 892 долари. GPT-5.2 з’їло 130 мільйонів (2304 долара), Claude Opus - 58 мільйонів (2486 доларів). Тобто однаковий обсяг інтелекту на Gemini обходиться у 2.6 рази дешевше.

Для звичайних користувачів є підписки. Google AI Plus за 8 баксів на місяць - це Pro-режим Gemini 3.1 Pro, Deep Research, 1000 картинок на день. Для більшості достатньо. Google AI Pro за 20 - це 100 запитів на день і 20 Deep Research. Google AI Ultra за 250 - це все вище плюс Deep Think і максимальний пріоритет.

Чому Google не підняв ціну? Кілька причин. По-перше, вони роблять ставку на доступність - безкоштовний AI Studio, щедрі безкоштовні токени, низькі API. По-друге, конкуренція. Anthropic випустила Claude Sonnet 4.6 - чудове співвідношення ціни і якості. OpenAI не спить. Щоб утримати розробників, потрібна хороша ціна. В-третіх, модель поки в preview, тож Google може демпінгувати, збираючи фідбек. Коли вийде у реліз, ціни можуть змінитися.

В цілому? Це дуже хороше оновлення. Логіка реально покращилася, ціна не зросла, якість коду швидко зростає. Не ідеальна, але дуже приваблива. Особливо якщо ви розробник, який рахує гроші і вміє читати специфікації.

Є, звичайно, нюанси. Якщо потрібно складний системний код - GPT-5.3-Codex може бути краще. Якщо готуєте презентації для ради директорів - Claude Sonnet 4.6 акуратніше. Якщо працюєте з конфіденційними даними - жодна з цих моделей не підходить, бо всі живуть на серверах США.

Але ось що реально важливо: моделі, які виходять сьогодні, завтра можуть застаріти. Поки я це писав, у лабораторіях Google, OpenAI і Anthropic інженери, ймовірно, вже натренували щось нове. Тож мій рада: візьміть Gemini 3.1 Pro, спробуйте на своїх реальних задачах. Якщо зайде - радійте і економте гроші. Якщо ні - є з чого обирати. Хороших моделей зараз багато, і це найкраща новина.
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріпити