#OpenAIGPT5.6


GPT-5.6 Вже Тут. Ви Не Можете Ним Скористатися.

Три дні тому OpenAI випустила свою найпотужнішу родину моделей на сьогодні — і майже ніхто не зміг до неї доторкнутися.

26 червня OpenAI представила GPT-5.6: три моделі під назвами Sol, Terra та Luna. Sol — флагман, Terra — збалансований середній рівень, а Luna — швидкий і дешевий варіант. На папері це саме те, чого ринок очікував після GPT-5.5 — чіткіша схема назв, прозора цінова драбина та новий режим міркування "Ultra" на Sol, який запускає підагенти для складних завдань. Ціни все розповідають про те, як OpenAI бачить рівні: Sol залишається $5/$30 за мільйон токенів (як у GPT-5.5), Terra зменшує це вдвічі до $2,50/$15, а Luna падає до $1/$6. Це не знижка на стару потужність — OpenAI подає Terra як інтелект рівня GPT-5.5 вдвічі дешевше, а Luna як масового гравця для всього, що не потребує передових міркувань.

Сама назва — це тихий сигнал. OpenAI відійшла від "mini" та "nano", тому що внутрішньо ці моделі насправді не менші — вони просто налаштовані на різні завдання. 5.6 — це родина; Sol, Terra та Luna — позиції, які продовжать незалежно розвиватися. Це той самий поділ продуктів, який Anthropic використовує з Opus, Sonnet та Haiku, лише з небесними назвами замість музичних.

Вимірювання, яке має значення — і те, яке не має

OpenAI вирішила опублікувати одне вимірювання: Terminal-Bench 2.1, яке тестує реальні завдання з кодування в термінальних середовищах — планування, ітерацію, координацію інструментів. Sol набрав 91,9%. Це перевершує 88,0% Claude Mythos 5 і є новим найкращим показником на цьому конкретному тесті.

Ось у чому підступ: Terminal-Bench 2.1 — це власні звіти OpenAI про результати на їхньому власному обраному вимірюванні. Коли Anthropic запускала ті самі моделі через свій міні-інструмент SWE-agent, GPT-5.5 впав з 88 до приблизно 81-83 — перевага звужується або зникає, коли кожна модель працює на одному оцінювачі. OpenAI не опублікувала SWE-Bench Pro, FrontierCode або Humanity's Last Exam — усі вимірювання, де Claude Fable 5 (який має ті самі ваги, що й Mythos 5) встановлював рекорди до свого вилучення. Отже, так, Sol перевершує Mythos на Terminal-Bench. Чи перевершує він Mythos широко — це твердження, яке OpenAI зробила обережно, з обмеженим формулюванням.

Є ще одна деталь. Системна картка OpenAI класифікує всі три моделі GPT-5.6 — не лише Sol — як такі, що мають "високий" ризик як для кібер-, так і для біологічних/хімічних можливостей. Вони оцінені нижче цього порогу щодо самовдосконалення ШІ. OpenAI також зазначила, що Sol "краще допомагає людям знаходити та виправляти вразливості, ніж надійно проводити атаки від початку до кінця" — обережно сформульоване запевнення, яке не каже, що він не може проводити атаки, просто він кращий на оборонній стороні. І OpenAI переглянула свою рамку готовності у квітні, вилучивши деякі сфери попередніх досліджень. Ці деталі не потрапляють у заголовки, але саме їх читають політики.

Справжня історія: Вашингтон тепер у циклі випуску

Причина, чому ви не можете скористатися GPT-5.6 зараз, не в інженерії. Це політика.

За два тижні до цього запуску адміністрація Трампа видала директиву про контроль експорту проти Anthropic, змусивши компанію вимкнути весь доступ до Fable 5 та Mythos 5 у глобальному масштабі — не лише для іноземних громадян, але для всіх, оскільки ізоляція іноземного доступу технічно була неможливою. Тригером стала повідомлена злам Fable 5, який продемонстрував, що можна отримати можливості на рівні кіберзброї. За словами Девіда Сакса, колишнього радника адміністрації з ШІ, генеральний директор Anthropic Даріо Амодей відмовився виправити злам або вилучити модель до видання наказу.

Коли OpenAI збиралася запустити GPT-5.6, Офіс національного кібердиректора та Управління наукової та технологічної політики Білого дому попросили OpenAI обмежити розгортання приблизно 20 затвердженими урядом партнерами перед будь-яким ширшим випуском. Адміністрація вважає GPT-5.6 "на рівні" з можливостями Mythos-класу. OpenAI погодилася — але з помітним опором. Сем Альтман сказав співробітникам, що цей підхід "не є нашою бажаною довгостроковою моделлю" і що OpenAI працюватиме над "більш стійким підходом до майбутніх релізів". У власному блозі компанія назвала обмежене розгортання "нестійким".

Отже, ми маємо фактично новий бар'єр: передові моделі тепер проходять через процес урядового схвалення перед публічним доступом. Поки що немає формальної рамки — кібервиконавчий наказ все ще розробляється. OpenAI розглядає обмежений попередній перегляд як "короткостроковий крок" і обіцяє ширшу доступність "найближчими тижнями", причому Альтман сказав журналістам, що уряд сигналізував про ймовірну прийнятність такого терміну. Anthropic тим часом отримав часткове виключення — Mythos 5 тепер може бути знову розгорнутий для організацій США, які керують критичною інфраструктурою, хоча Fable 5 залишається повністю призупиненим.

Чому це важливіше за вимірювання

Запуск GPT-5.6 — це насправді не історія про технології. Це історія про управління, загорнута в анонс продукту.

Розглянемо хронологію: Anthropic випускає Fable 5 9 червня. За кілька днів демонструється злам. До 13 червня наказ про контроль експорту змушує повне відключення. Через два тижні переговорів, зі співробітниками Anthropic, які таборували у Вашингтоні. До 26 червня OpenAI запускає GPT-5.6 в обмежений попередній перегляд, узгоджений з тією самою адміністрацією. Повідомлення для кожної лабораторії ШІ зрозуміле: якщо ваша модель досягає можливостей Mythos-класу, уряд США буде в процесі вашого випуску, подобається вам це чи ні.

Ось зсув, який ніхто не називає. Ми перейшли від "лабораторія вирішує, коли і як випускати" до "уряд вирішує, хто отримує доступ першим". Рамка ще не існує. Процес є ad hoc. Критерії нечіткі. OpenAI співпрацює, тому що бачить це як найшвидший шлях до можливого широкого випуску. Anthropic боровся і програв. Наступна лабораторія — Google DeepMind, хто завгодно — зіткнеться з тим самим бар'єром.

Для розробників та підприємств практичний вплив негайний. Ваш ChatGPT досі на GPT-5.5. Ваш API не має кінцевих точок GPT-5.6. Приблизно 20 схвалених партнерів — це великі організації, перевірені урядом. Якщо ви створюєте продукти, які залежать від доступу до передових моделей, ваш дорожній тепер має змінну, яку ви не можете контролювати: термін схвалення Вашингтона.

Ціни агресивні — і це стратегічно

Terra за половину ціни флагмана за можливості класу GPT-5.5 — це не просто хороша угода. Це хід для створення рову. OpenAI встановлює ціни на Terra та Luna, щоб зробити всі інші моделі середнього та бюджетного рівнів економічно невигідними. Якщо Terra забезпечує якість GPT-5.5 за $2,50/$15, реальний ціновий тиск на Sonnet-рівень Anthropic та моделі середнього рівня Google є. Luna за $1/$6 націлена прямо на масові розгортання — кол-центри, конвеєри контенту, завдання класифікації — де вартість токену має більше значення, ніж піковий інтелект.

Ця цінова політика працює лише в масштабі OpenAI і працює лише якщо широкий доступ з'явиться скоро. Модель, яку можуть використовувати 20 компаній, це не цінова зброя. Це демо. Реальний конкурентний вплив залежить від того, чи досягне GPT-5.6 загальної доступності за тижні, як обіцяно, чи урядовий бар'єр затягнеться довше.

Що я відстежую далі

Чи виконається обіцянка "найближчих тижнів". Середина липня — це шепітна ціль для ширшого доступу до ChatGPT та API. Будь-яка затримка змінює конкурентне вікно.

Наступний крок Anthropic. Mythos 5 має часткове виключення для організацій критичної інфраструктури. Fable 5 досі вимкнено. Плани Anthropic щодо IPO, як повідомляється, йдуть за графіком на пізніше цього року — але ви не можете виходити на публічний ринок зі своєю флагманською моделлю під експортним контролем.

Рамка виконавчого наказу. Зараз процес є індивідуальним без опублікованих критеріїв. Коли з'являться формальні правила, вони визначать бар'єр випуску для кожної лабораторії, не лише OpenAI та Anthropic.

Крос-валідація вимірювань. Результат Sol у 91,9% на Terminal-Bench вражає. Незалежна оцінка на інструменті Anthropic та в ширших наборах вимірювань визначить, чи це справжній стрибок у можливостях, чи обмежене твердження.

GPT-5.6 — найсильніша модель, яку коли-небудь створювала OpenAI. Це не оспорюється. Але історія цього запуску — не модель, а бар'єр. Вперше передовий реліз ШІ не пішов одразу до користувачів. Він пішов спочатку до Вашингтона, і Вашингтон вирішив, хто потрапить. Те, як цей бар'єр еволюціонуватиме, сформує наступне десятиліття розгортання ШІ більше, ніж будь-який результат вимірювань.
Переглянути оригінал
post-image
post-image
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріплено