Взрывной инсайдерский спойлер о GPT-5.4! Возможно, с постоянной памятью и экстремальным развитием логического мышления

Если вам кажется, что в последнее время в сфере ИИ немного тихо и скучно, возможно, это всего лишь спокойствие перед бурей.

По различным источникам, GPT-5.4 уже на подходе!

На LMArena уже появились изображения GPT-5.4.

Только что иностранное издание The Information раскрыло множество ключевых деталей о GPT-5.4.

Информация настолько впечатляющая: у него будет более длинный контекст, более экстремальная модель логического вывода, а возможно, даже постоянная память!

Если, как говорят слухи, всё это правда, то эта версия модели, скорее всего, не просто обновление, а значительный скачок в возможностях.

Предварительное тестирование GPT-5.4, утечка кода и скандальные детали

В последнее время GPT-5.4 буквально просачивается повсюду.

От ошибок в Codex, PR на GitHub до случайных скриншотов сотрудников — за несколько дней GPT-5.4 уже «раскрыли» как минимум три раза.

И всё это — случайные утечки со стороны OpenAI.

Первым это заметил разработчик Corey Noles, когда при использовании OpenAI Codex произошла сетевая блокировка, и в логах системы появилась очень длинная строка с названием модели:

Самое важное — первые три символа: gpt-5.4.

В целом, эта строка считается внутренним ID развертывания OpenAI, что переводится как «реальная тестовая версия GPT-5.4, запущенная в производство».

Затем в официальном репозитории OpenAI Codex появились два Pull Request:

Один из них гласил:

Другой — более прямо:

Похоже, OpenAI добавила для GPT-5.4 переключатель «Fast Mode». Через несколько часов оба PR были force push-ены и удалены.

Далее последовала более драматичная сцена: сотрудник команды Codex Tibo опубликовал в соцсетях скриншот. На нем видно, что в селекторе моделей явно указана GPT-5.4.

Вскоре этот пост был удален.

Позже разработчики сообщили, что в ошибках Codex встречаются похожие строки с названиями моделей.

Это еще раз подтверждает, что GPT-5.4 уже развернут на внутренних серверах и проходит реальные A/B тесты.

Один запрос — 6000 строк кода?

Кроме того, уже есть сообщения о заметных изменениях — скорости!

Некоторые тестировщики отмечают, что вывод модели стал заметно быстрее, генерация кода длиннее, а один запрос теперь может дать более 6000 строк кода!

Это раньше было практически невозможно.

Некоторые также обнаружили новую функцию — Fast Mode.

Возможно, OpenAI экспериментирует с новыми архитектурами логического вывода, например, многоуровневыми pipeline с задержками или моделями с разной скоростью работы.

Также были замечены новые интерфейсные особенности: некоторые пользователи отмечают, что рядом с цепочкой рассуждений (Chain-of-Thought) могут появиться кнопки «лайк» и «дизлайк», что может означать, что аккаунт уже подключен к тестовой модели GPT-5.4.

Экстремальный режим логического вывода — взрывной рост производительности

Информация от The Information полностью подтверждает вышеизложенное.

Самое яркое в этом раскрытии — это так называемый экстремальный режим рассуждений — Extreme Reasoning Mode.

Традиционные модели ограничены по времени размышлений, но этот режим позволяет модели работать на пределе — при сложных задачах она может тратить больше времени, привлекать больше вычислительных ресурсов и выполнять более глубокие рассуждения.

Интересно, что по опросам, большинство обычных пользователей ChatGPT не очень заинтересованы в расширенных возможностях логического вывода.

С коммерческой точки зрения, эта функция не очень актуальна, так как бизнесу важен быстрый ответ ИИ.

Поэтому, то, что OpenAI так ценит логические способности, кажется, более мотивировано научными интересами.

Однако для научных исследований и некоторых корпоративных клиентов это — огромный плюс.

Очевидно, что в научной сфере многие готовы позволить модели работать часами или даже днями над ценными исследовательскими задачами.

Также некоторые компании нуждаются в более мощных логических возможностях GPT-5.4 и в долгосрочной обработке задач для автоматизации сложных бизнес-процессов.

По слухам, этот экстремальный режим рассуждений будет очень «безумным», что вызывает повышенный интерес.

Двойной размер контекста — до 1 миллиона токенов

Для GPT-5.4 это еще одно очень серьезное обновление — окно контекста увеличено с 400 тысяч до миллиона токенов.

Теперь окно контекста GPT-5.4 превышает в два раза текущий GPT-5.2. (Конечно, есть модели OpenAI, поддерживающие 1 миллион токенов, например GPT-4.1, но GPT-5.2 — нет).

Это позволит GPT-5.4 напрямую обрабатывать десятки тысяч страниц документов, анализировать целую книгу или длинные кодовые базы и датасеты.

Это также позволяет модели в долгом контексте конкурировать с Gemini от Google и Claude от Anthropic.

Другие компании давно достигли 1 миллиона токенов, и GPT-5.4 наконец восполняет этот пробел.

А по более смелым слухам, контекст может достигать 2 миллионов токенов!

GPT-5.4 — мастер «длинных задач»

Еще один интересный момент — в тестовых данных отмечается улучшение скорости работы.

Некоторые тестировщики отмечают, что модель стала значительно быстрее в логике, а генерация кода — длиннее, и один запрос теперь может дать более 6000 строк.

Это раньше было практически невозможно.

Также обнаружена новая функция — режим быстрого вывода Fast Mode.

Это может означать, что OpenAI экспериментирует с новыми архитектурами логического вывода, например, многоуровневыми pipeline с задержками или моделями с разной скоростью.

Кроме того, заметна новая интерфейсная особенность: у части пользователей рядом с цепочкой рассуждений появляются кнопки «лайк» и «дизлайк», что может свидетельствовать о том, что аккаунт уже подключен к тестовой версии GPT-5.4.

Возможна постоянная память — самая безумная новость

Самая горячая новость — GPT-5.4, возможно, обладает постоянной памятью!

Один инженер в X опубликовал эту информацию, вызвав бурю в сообществе ИИ, а основатель YC Гарри Тэн быстро репостнул.

В этом посте автор рассказывает о «долгосрочном состоянии» GPT-5.4.

Джефф Дин из Google упоминал это в подкасте latentspacepod, показывая, что крупные лаборатории уже работают в этом направлении.

Есть предположения, что внутри OpenAI уже нашли способ эффективно объединять модели состояния (SSM) и трансформеры.

Ключевое — дизайн SSM, который передает скрытое состояние на каждом шаге, при этом его сложность растет линейно, в отличие от квадратичного роста у трансформеров.

Это подтверждает слухи о том, что GPT-5.4 может иметь окно контекста в 2 миллиона токенов.

Постоянное состояние — это, по сути, возможность AI сохранять долгосрочную память, подобно тому, как в фильме «Мементо» герой Guy Pearce не может запомнить ничего, а Dustin Hoffman в «Rain Man» обладает стабильной памятью.

Это даст AI по-настоящему долгосрочную память.

Если реализовать — это будет огромный технологический прорыв!

(

Давление растет — OpenAI вынуждена «обновляться» ежемесячно

Очевидно, после GPT-5 OpenAI начал активно обновлять модели — теперь они выходят почти каждый месяц.

В этом году уже вышли GPT-5.1, GPT-5.2, скоро — GPT-5.4, обновления идут с почти ежемесячной регулярностью.

Это связано с давлением конкурентов.

Сейчас у ChatGPT около 910 миллионов активных пользователей в неделю, что кажется впечатляющим, но все равно не достигает цели OpenAI — 1 миллиарда активных пользователей.

Google и Anthropic не стоят на месте, активно развивая длинный контекст, агенты и логические возможности.

Если GPT-5.4 действительно получит 1 миллион токенов, экстремальный режим и постоянную память, то AI может превратиться в постоянно работающего интеллектуального агента.

И если GPT-5.4 сможет «запоминать» — это станет ключевым моментом в истории больших моделей.

Сингулярность уже близко, мы мчимся вперед. Ты готов?

Источник: Синьчжиюань

Риск и отказ от ответственности

Рынок подвержен рискам, инвестируйте осторожно. Настоящий материал не является инвестиционной рекомендацией и не учитывает индивидуальные цели, финансовое положение или потребности пользователя. Пользователь сам несет ответственность за любые решения, основанные на этой информации.

Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Закреплено