OpenAI соучредитель в эксклюзивном интервью: после закрытия Sora, что будет следующим шагом для ChatGPT?

Название видео: Президент OpenAI Грег Брокман: стратегия ИИ, AGI и суперприложение

Автор видео: Алекс Кантровиц

Перевод: Пегги, BlockBeats

Примечание редактора: Эта статья переведена с разговора Грега Брокмана — президента OpenAI и сооснователя — в подкасте Big Technology. Программа долгое время уделяет внимание изменениям в ИИ, технологической отрасли и бизнес-структуре, и является важным окном, чтобы отслеживать выводы с первой линии в Силиконовой долине.

На этом интервью Брокман не остановился на самих возможностях модели. Он сместил вопрос дальше: когда способности ИИ уже в основном подтверждены, как индустрия будет выбирать путь, перестраивать формы продуктов и принимать системный эффект, который это принесёт. Разговор сосредоточился на продуктовой стратегии OpenAI, готовящемся «суперприложении» и оценке того, что ИИ входит в «этап взлёта».

Это интервью можно понять с трёх сторон.

Во-первых, происходит схождение путей.
От генерации видео до рассуждающих моделей, от параллельного движения по многим направлениям к активному выбору — выбор OpenAI не является простым суждением о технических преимуществах. Это ответ на реальные ограничения: вычислительные мощности стали ключевым узким местом. В условиях ограниченных ресурсов технологические маршруты начали сходиться к двум направлениям с наибольшим эффектом рычага: персональные ассистенты и решение сложных проблем. Это также означает, что конкурентная логика ИИ меняется: от «что он умеет» к «что он должен делать в первую очередь».

Во-вторых, происходит перестройка формата.
Предложение «суперприложения» по сути является прыжком в формате продукта. ИИ больше не набор разрозненных инструментов — это единый вход: он понимает контекст, вызывает инструменты, выполняет задачи и, в разных сценариях, продолжает накапливать память. От ChatGPT до Codex ИИ постепенно берёт на себя целый рабочий процесс, а роль людей смещается от исполнителя к диспетчеру: постановка целей, распределение задач и надзор.

В-третьих, меняется ритм.
Если прошлые два года были этапом подъёма возможностей, то сейчас происходит «взлёт». С одной стороны, способность моделей от «помощи примерно в 20% работы» поднялась до «охвата примерно 80% задач», что напрямую запускает перестройку рабочих процессов. С другой стороны, ИИ сам участвует в собственной эволюции (использование ИИ для оптимизации ИИ), плюс синхронизация чипов, приложений и корпоративной стороны, формируя замкнутый контур ускорения. ИИ больше не точечная технология — он начинает становиться ключевым двигателем роста экономики.

Но при этом одновременно появляются и другая группа вопросов: недоверие общества, неопределённость в занятости, споры, вызванные дата-центрами, а также границы безопасности и управления. Ответ Брокмана не полностью находится внутри технологий. Он сильнее подчёркивает две вещи: во‑первых, риски нельзя решить через «централизованный контроль» — нужно выстроить социальную инфраструктуру вокруг ИИ, наподобие энергосистемы. Во‑вторых, меняется трансформация индивидуальных возможностей: по-настоящему важным становится не «умеешь ли ты пользоваться инструментами», а «можешь ли ты достигать своих целей с помощью ИИ».

Если раньше вопрос был «что ИИ умеет», то теперь вопрос звучит так: когда ИИ начинает выполнять за тебя большую часть задач, что тебе всё ещё нужно делать?

Ниже приводится текст оригинала (для удобства понимания в исходный материал были внесены некоторые перестановки и компоновка):

TL;DR

AGI уже вошёл в этап «ясного пути»: Грег Брокман (OpenAI, соучредитель) считает, что рассуждающие модели на базе GPT уже имеют чёткий маршрут к AGI; ожидается реализация в течение нескольких лет, но форма будет «неравномерной» (jagged).

Примечание: AGI (Artificial General Intelligence) — универсальный искусственный интеллект, то есть AI‑система, которая обладает возможностями, сопоставимыми с человеческими и даже превосходящими их, почти во всех когнитивных задачах. В отличие от текущего «специализированного ИИ» (например, распознавание изображений, рекомендательные алгоритмы) AGI делает акцент на универсальности между задачами и способности к переносу.

**Стратегическое схождение: от многолинейных поисков к двум ключевым применениям: ** При ограничении вычислительных мощностей OpenAI концентрирует ресурсы на «персональном ассистенте» и «решении сложных проблем», а не на одновременном продвижении всех направлений (например, генерации видео).

**«Суперприложение» станет формой входа для ИИ: ** Чат, программирование, браузер и работа со знаниями будут объединены в единую систему; ИИ из инструмента превратится в «исполнительный уровень», а пользователи сместятся в роль «диспетчера».

**Ключевой перелом: ИИ начинает брать на себя рабочие процессы, а не просто помогать: ** Возможности модели поднялись с «выполнения 20% задач» до «возможности взять на себя 80%», заставляя людей и компании перестраивать способы работы.

**Вычислительные мощности — ключевое узкое место и главный фокус конкуренции: ** Спрос на ИИ намного превышает предложение; в будущем ограничения будут не в возможностях модели, а в вычислительных ресурсах — дата-центры и инфраструктура станут ключевыми переменными.

**«Взлёт» ИИ (takeoff) уже происходит: ** Техническое самоускорение (AI оптимизирует AI) в сочетании с согласованием в индустрии (чипы, приложения, компании) продвигает ИИ от роли инструмента к роли движка роста экономики.

**Самый большой риск — не в технологиях, а в управлении и способе использования: ** Проблемы безопасности нельзя решить силами одного единственного субъекта; нужно, чтобы открытая экосистема и социальная инфраструктура приняли этот вызов вместе.

**Ключевая трансформация индивидуальных возможностей: ** В будущем конкурентоспособность будет заключаться не в «исполнении», а в «постановке целей + управлении системой ИИ»; активное использование ИИ станет базовым навыком.

Сводка разговора:

Alex (ведущий):
Сегодня у нас в гостях сооснователь и президент OpenAI Грег Брокман — поговорим о самых перспективных возможностях ИИ, о том, как OpenAI будет пользоваться этими шансами, и о концепции «суперприложения». Сегодня Грег тоже в нашей студии записи.

Greg Brockman (OpenAI, соучредитель & президент):
Рад вас видеть. Спасибо за приглашение.

Почему закрывают Sora? Не хватает вычислительных мощностей

Alex:
Этот момент времени действительно интересен. OpenAI приостанавливает продвижение генерации видео и концентрирует ресурсы на «суперприложении» — оно будет интегрировать коммерческие и программные сценарии. Со стороны (включая меня) это выглядит так, будто OpenAI уже лидирует на потребительском конце, но теперь они меняют распределение ресурсов. Что именно происходит?

Примечание: В марте 2026 года OpenAI объявила о закрытии своего продукта генерации видео Sora (включая приложение и API) и о прекращении соответствующих коммерческих продвижений.

Greg Brockman:
В последние периоды мы разрабатывали эту технологию глубокого обучения и хотели проверить, действительно ли она может оказать тот позитивный эффект, который мы всегда представляли: можно ли использовать её для создания приложений, которые реально помогают людям и улучшают жизнь.

Вместе с тем мы параллельно делали и другое: разворачивали эту технологию «наружу». С одной стороны — чтобы поддерживать работу бизнеса, с другой — чтобы заранее накопить опыт в реальном мире, подготовившись к моменту, когда технология действительно созреет.

И сейчас мы уже вошли в новый этап. Мы видим, что эта технология действительно работает. Мы уходим от «бенчмарков» и демонстраций некоторых более абстрактных возможностей в новый этап — её нужно поставить в реальный мир, чтобы она участвовала в реальной работе и продолжала эволюционировать благодаря обратной связи пользователей.

Поэтому я скорее склонен рассматривать это изменение как стратегический поворот, вызванный сменой технологического этапа.

Это не означает, что мы переключаемся с «потребительской стороны» на «корпоративную сторону». Если точнее, мы задаём вопрос: при ограниченных ресурсах какие приложения нам следует ставить в приоритет? Потому что мы не можем делать всё сразу.

Какие приложения действительно можно довести до практического внедрения, которые будут синергировать между собой и давать реальный эффект? Если перечислить все направления, то на потребительской стороне это можно разложить на множество вариантов: например, персональный ассистент — система, которая действительно понимает вас, согласована с вашими целями и помогает достигать ваших жизненных целей. Или, например, творчество и развлечения. И есть много других возможностей. А на корпоративной стороне, если смотреть на более высоком уровне, это можно свести к одной вещи: у вас есть сложная задача — может ли AI помочь вам её выполнить?

Для нас приоритеты сейчас очень ясны: на первом месте всего две вещи. Первая — персональный ассистент. Вторая — AI, который помогает решать сложные проблемы.

Проблема в том, что наши текущие вычислительные мощности даже не тянут покрыть эти две задачи целиком. Как только добавляется ещё больше сценариев приложений, становится невозможно охватить всё. Поэтому это в действительности реалистичное решение: технология быстро созревает, а влияние вот‑вот начнёт взрываться. Нам нужно делать выбор и выбрать самые важные направления, чтобы действительно довести их до готовности.

Alex:
Вы упоминали ранее один аналогичный пример: OpenAI чем-то похожа на Disney — есть базовое ключевое умение, а затем оно разворачивается в разные сценарии. У Disney есть Микки Маус, и на его основе можно делать фильмы, тематические парки, Disney+. «Ключ» OpenAI — это модель: вы можете делать генерацию видео, делать ассистентов, делать корпоративные приложения.

Но теперь, похоже, вы уже не идёте по пути «полного развертывания во все стороны», и вам приходится выбирать?

Greg Brockman:
На самом деле я считаю, что этот аналог сейчас даже более подходит. Но есть ключевой момент: с технологической точки зрения Sora (видеомодель) и GPT (рассуждающая модель) относятся к двум разным ветвям технологий. Способы их построения совершенно разные.

Проблема в том, что на текущем этапе одновременно развивать две ветви технологического дерева — крайне трудно, особенно в условиях ограниченных ресурсов. Поэтому наш выбор таков: в нынешнем этапе основные ресурсы концентрируем на пути GPT.

Конечно, это не означает, что мы отказались от остальных направлений. Например, в области робототехники мы продолжаем соответствующие исследования. Но сама робототехника ещё находится на более раннем этапе: она не вошла в настоящую стадию зрелого взлёта.

По сравнению с этим, в течение следующего года мы увидим реальный взлёт AI в сфере работы со знаниями.

И ещё важно подчеркнуть: маршрут GPT — это не только «текст». Например, двустороннее голосовое взаимодействие (speech-to-speech) — тоже часть этого технологического пути. Оно сделает AI более доступным и более практичным. В основе эти возможности всё ещё находятся в одном и том же модельном семействе: они настраиваются разными способами.

Но если вы идёте по двум совершенно разным технологическим ветвям, в условиях ограниченных вычислительных мощностей трудно поддерживать это долго. А вычислительные мощности ограничены потому, что — спрос слишком велик. Почти каждый раз, когда выходит новая модель, люди хотят использовать её для большего количества задач.

Alex:
Тогда почему вы не делаете основной упор на «мир-модели»? Например, видеомодели, чтобы понимать отношения между объектами — это критично и для робототехники. И прогресс у Sora на самом деле очень быстрый. Почему в итоге вы делаете ставку на GPT?

Примечание: «World Model» (мир-модель) делает акцент на восприятии и физической интуиции. Её ключ — помочь AI понять «как устроен мир», а не просто учить «поверхностные паттерны данных». Такие модели обычно используются для описания систем вроде Sora: они не только генерируют изображения или видео, но и моделируют отношения между объектами (например, люди, машины, свет), непрерывное изменение во времени (эволюция между кадрами) и базовые физические законы (например, движение, перекрытие и столкновения). В отличие от этого GPT — это языковая и рассуждающая модель, которая больше ориентирована на абстрактное познание и выполнение задач.

Greg Brockman:
Главная проблема в этой области заключается в том, что возможностей слишком много.

Мы очень давно поняли в OpenAI: как только идея становится математически обоснованной, она обычно «взлетает» и приносит хорошие результаты. Это говорит о том, что базовые способности deep learning действительно сильны: они извлекают из данных правила генерации и переносятся на новые сценарии. Это можно использовать для мир-моделей, научных открытий, программирования — в самых разных областях.

Но ключевой момент — нужно выбирать, что именно делать.

Долгое время шёл спор о том, насколько далеко смогут зайти текстовые модели: действительно ли они понимают мир. Я считаю, что на этот вопрос сейчас уже есть ответ: текстовые модели могут дойти до AGI.

Мы уже видим чёткий путь. В этом году появятся ещё более сильные модели. А одна из самых болезненных задач внутри OpenAI — это то, как распределять вычислительные мощности. Эта проблема будет только усугубляться, а не облегчаться. По сути, это не вопрос «какой маршрут важнее», это вопрос момента и порядка.

Сейчас часть приложений, которые мы раньше считали далёкими, стала досягаемой. Например, решение физики, которая до сих пор не решена. У нас недавно был такой кейс: физик долго изучал одну проблему. Он передал её модели — и через 12 часов мы дали решение. Он сказал, что это было впервые, когда он почувствовал, что модель «думает». Эта проблема, возможно, даже такая, которую люди никогда бы не смогли решить, но AI справился.

Когда вы видите подобное, у вас остаётся только один выбор: удвоить ставки, утроить вложения. Потому что это означает, что мы действительно можем раскрыть огромный потенциал.

Поэтому для меня это не конкуренция между направлениями. Это вопрос: какова миссия OpenAI? Как привести AGI в мир? Как сделать так, чтобы он реально принёс пользу всем? И мы уже видели тот путь — мы знаем, как его продвигать.

Ставка на GPT, а не на мир-модели: выбор пути к AGI

Alex:
Хорошо, я действительно хочу вернуться к тому, что вы только что упомянули про следующее поколение моделей. Но сначала я уточню этот вопрос.

Ранее в этом году я общался с Демисом Хассабисом из Google DeepMind. И мне показалось интересным, что он сказал: для него ближе всего к AGI оказался их генератор изображений под названием Nano Banana.

Примечание: Демис Хассабис — один из ключевых людей, который помог вывести AI из исследования в прорывные приложения. Он основал DeepMind, а в 2016 году AlphaGo победила чемпиона мира по го в матче, став знаковым событием в истории развития искусственного интеллекта.

Его аргумент был таким: и генератор изображений, и генератор видео по сути должны понимать отношения между объектами, как минимум иметь какое-то представление о том, как работает мир.

Тогда означает ли это потенциальный риск? Это большая ставка. Если всё так, то не может ли OpenAI, продолжая наращивать усилия на другой ветке технологий, упустить что-то важное?

Greg Brockman:
Если действительно так — то у меня есть два ответа.

Первое: конечно, такой риск существует. В этой области неизбежно приходится делать выбор и делать ставки. OpenAI с самого начала занимался этим: мы должны решить, какой маршрут к AGI считаем верным, и максимально сфокусированно идти по нему. Это похоже на случайное сложение векторов: в конце результат может быть близок к нулю. Но если вы выравниваете все векторы, они подтолкнут вас в чётком направлении.

Второе: генерация изображений — это ещё и очень популярная возможность в ChatGPT. Мы продолжаем вкладываться и приоритезировать это. Мы можем это делать потому, что на самом деле это не относится к «мир-моделям» или к ветке «диффузионных моделей». Фактически это построено на архитектуре GPT. Хотя данные распределяются по‑разному, на более глубоком уровне — в основе стека технологий — там всё равно одна и та же база.

И именно в этом, как мне кажется, одна из самых удивительных сторон AGI: иногда приложения, которые выглядят совершенно разными — voice-to-voice, генерация изображений, обработка текста и даже то, как текст применяется в научных исследованиях, программировании и личной информации о здоровье — всё это может быть включено в один и тот же технологический каркас.

Поэтому с технической точки зрения одна из вещей, о которых мы внутри компании постоянно думаем, — как максимально унифицировать направления усилий. Потому что мы правда считаем, что эта технология даст системное улучшение и даже повысит уровень всей экономической системы.

Но масштаб слишком велик. Конечно, мы не можем сделать всё. Но мы можем сделать свою часть — ту, которая относится к нашему вкладу.

Alex:
Это как раз то, что в «Artificial General Intelligence (AGI)» означает слово «general».

Greg Brockman:
Да, именно так. Это и есть смысл той буквы G.

Alex:
Раз уж вы говорите про «унификацию», как будет выглядеть это суперприложение?

Greg Brockman:
Суперприложение в моём понимании — это—

Alex:
Оно объединит чат, программирование, браузер и то, что сейчас есть как ChatGPT, верно?

Greg Brockman:
Да. Мы хотим сделать приложение для конечного пользователя, которое позволит почувствовать силу AGI — то есть его «универсальность».

Если подумать о сегодняшних чат‑продуктах, я считаю, что они будут постепенно превращаться в персонального ассистента — в твой личный API, то есть в по-настоящему AI, который учитывает тебя. Он будет понимать тебя, знать о тебе много информации, быть согласованным с твоими целями, вызывать доверие и в какой-то степени «представлять» тебя в цифровом мире.

Что касается Codex, вы можете представить это так: сейчас это инструмент в основном для софтверных инженеров, но он превращается в «Codex для всех».

Любой, кто хочет что-то создавать и строить, сможет использовать Codex, чтобы компьютер делал то, что он хочет. Причём это уже не просто «писать код» — это похоже на «использовать компьютер» как таковой. Например, я могу попросить его помочь мне настроить ноутбук. Иногда я забываю, как настраиваются hot corners (горячие углы), и я просто прошу Codex — и он реально делает.

Вот как должен выглядеть компьютер: он должен подстраиваться под человека, а не заставлять человека подстраиваться под него.

Поэтому вы можете вообразить приложение, которому вы просто говорите, что вы хотите, чтобы компьютер сделал. Встроятся возможности «управления компьютером» и «управления браузером», чтобы AI мог реально работать с веб‑страницами, а вы могли наблюдать за тем, что он делает. И независимо от того, как именно вы взаимодействуете — в чате, пишете код или занимаетесь обычной работой со знаниями — все эти диалоги будут объединены в одной системе. У AI будет память, он будет понимать вас.

Именно это мы и строим.

Но если честно, это всё равно лишь верхушка айсберга. Для меня по-настоящему важна унификация базовой технологии.

Мы уже упоминали унификацию на уровне базовых моделей. Но то, что реально менялось за последние годы, — это было не только «про модели» как таковые. Самое важное теперь — «система‑носитель». То есть: как модель получает контекст? Как она подключается к реальному миру? Какие действия может предпринимать? Когда новый контекст постоянно поступает, как устроен цикл взаимодействия с пользователем?

Раньше внутри компании всё это реализовывалось разными способами — у нас было несколько реализаций или хотя бы несколько слегка отличающихся подходов. Сейчас мы их сводим в одну. В итоге мы получим унифицированный AI‑слой, а затем очень лёгким способом направим его на разные конкретные сценарии применения.

Вы, конечно, всё ещё можете делать маленький плагин или маленький интерфейс, специализированный под финансы или под право. Но в большинстве случаев вам это даже не понадобится: само это суперприложение будет достаточно широким и достаточно универсальным.

Alex:
Это приложение ориентировано и на корпоративные сценарии, и на персональные?

Greg Brockman:
Да. И это как раз его суть. Как с компьютером: например, ваш ноутбук — он для личных целей или для работы? Ответ: и то, и другое. Сначала это ваше устройство — интерфейс, через который вы входите в цифровой мир. И именно это мы хотим сделать.

Alex:
А если говорить с точки зрения некоммерческой жизни: если я использую это суперприложение в личной жизни, что я буду с его помощью делать? Как изменится моя жизнь?

Greg Brockman:
Я бы это понял так: в личной жизни оно в первую очередь будет продолжать то, как вы сегодня используете ChatGPT.

Как вы используете ChatGPT сейчас? Люди уже применяют его для самых разных и по‑настоящему удивительных задач. Иногда достаточно просто сказать: «Помоги мне набросать речь для свадебного тоста» или «Можешь посмотреть мою идею и дать обратную связь?» Или, например: «Я делаю маленький бизнес — можешь дать мне пару идей?»

Часть этих сценариев больше личная, часть уже размывает границу между личным и рабочим. И моё мнение такое: все эти вопросы должны быть переданы суперприложению.

Greg Brockman:
Но если посмотреть на развитие ChatGPT, то станет видно, что он сам уже меняется.

Раньше у него не было памяти, верно? Для каждого человека это был один и тот же AI, который каждый раз начинал почти с нуля — как будто вы говорите с незнакомцем. Но если бы он мог запоминать вас и прошлые взаимодействия, он стал бы намного сильнее. И если бы он мог подключаться к ещё большему контексту, он тоже стал бы сильнее.

Например, пусть он подключится к вашей почте и вашему календарю. Он действительно поймёт ваши предпочтения, у него появится более глубокий набор контекстных данных об вашем прошлым опыте, и затем он сможет использовать эту информацию для достижения ваших целей. Или, например, в ChatGPT уже есть функция под названием Pulse: она каждый день будет, основываясь на том, что он знает о вас, сама подталкивать вас к тому контенту, который вам может быть интересен.

По сути, на персональном уровне суперприложение будет включать всё это и делать это глубже и богаче.

Alex:
Когда вы планируете выпустить его?

Greg Brockman:
Если точнее понимать: в ближайшие несколько месяцев мы шаг за шагом будем двигаться в этом направлении. Полное видение, о котором мы говорим, будет постепенно передаваться пользователям, но не выйдет целиком одним релизом: оно будет появляться поэтапно.

Например, сегодня приложение Codex уже по сути содержит два слоя: один — это универсальная система каркаса для агента (agent harness), она может использовать инструменты; второй — это агент, который особенно хорошо умеет писать софт.

И этот универсальный слой‑носитель на самом деле можно использовать во многих других сценариях. Подключите его к электронным таблицам — и он будет помогать с работой со знаниями. Подключите к Word‑документам — и он будет помогать.

Поэтому наш первый шаг — сделать приложение Codex ещё более полезным для универсальной работы со знаниями. Потому что внутри OpenAI мы уже видим: люди сами начинают использовать его именно так.

Это будет первым шагом. Дальше будет много шагов.

Alex:
Вчера я говорил с одним из ваших коллег о Codex, и он упомянул, что есть человек, который использует Codex для видеомонтажа: он просит Codex обработать видео, и Codex даже сделал плагин для Adobe Premiere — разбивает видео на главы и начинает монтаж. Это именно то направление, которое вы хотите?

Greg Brockman:
Мне очень нравится слышать такие кейсы. Именно так, как мы хотим, чтобы этот системный подход работал. И ещё интересная деталь: приложение Codex изначально разрабатывалось для софтверных инженеров, поэтому для тех, кто не программист, его текущая полезность не столь высока. Потому что при настройке возникает много мелких проблем.

Разработчики сразу понимают, что это значит, и знают, как это исправить — мы к этому привыкли. Но если вы не разработчик, вы видите эти моменты и думаете: «Что это за штука? Я никогда раньше такого не видел».

И всё же даже так мы видим, что люди, которые никогда не писали код, уже используют его, чтобы собирать сайты, или делать то, что вы только что описали — автоматизировать взаимодействие между разными программами и получать огромный рычаг. Например, у нас в коммуникационной команде кто-то подключил Codex к Slack и почте, чтобы он обработал массу обратной связи и сделал очень хороший конспект и компоновку.

Поэтому сейчас получается так: люди с высокой мотивацией уже готовы пересечь эти пороги и получать от этого очень высокую отдачу.

В каком-то смысле самая сложная часть уже сделана: у нас есть реально умный AI, который умеет и обладает способностью выполнять задачи на практике.

Дальше нужно сделать относительно «лёгкую» часть: сделать его действительно полезным для широкой аудитории, постепенно убирая входные барьеры.

Alex:
А если смотреть на конкурентную картину: у Anthropic сейчас есть приложение Claude — и чат‑боты, и Claude Code. В некоторой степени у них уже есть зачаток их «суперприложения».

Как вы думаете, почему Anthropic пришла к этому шагу раньше? И как вы оцениваете шанс OpenAI догнать?

Greg Brockman:
Если отмотать время на 12–18 месяцев назад, мы, по сути, всегда считали «программирование» приоритетной областью и в разных соревнованиях по программированию, а также в тестах «чистой способности» стабильно показывали лучшие результаты. Но тогда мы недоинвестировали в один момент — в «последнюю милю» доступности.

То есть мы недостаточно серьёзно относились к вопросу: AI уже очень умный, он решает сложные задачи по программированию, но он никогда не сталкивался с кодовой базой реального мира. А в реальном мире кодовые базы обычно хаотичны и далеки от тех «чистых» сред, к которым он привык.

В этом мы действительно тогда отставали. Но примерно с середины прошлого года мы начали очень серьёзно наверстывать. Мы специально сформировали команду, которая посмотрела, где именно эти пробелы, и какая реальная сумятица и сложность присутствуют в мире, с чем мы раньше не сталкивались.

Например: как строить тренировочные данные? Как собирать тренировочную среду? Чтобы AI действительно почувствовал, что такое «делать софтверную инженерию» — чтобы его прерывали, чтобы он сталкивался с странными проблемами и с разными неидеальными ситуациями, и так далее.

Я думаю, сейчас мы уже догнали. Когда пользователи реально ставят нас и конкурентов в прямое сравнение, многие выбирают нас.

Конечно, мы также понимаем, что в пользовательском опыте на фронте у нас есть разрыв. Мы это будем закрывать. Но в целом направление такое: не просто сделать модель и сверху дополнительный «продуктовый кожух», а с самого начала думать об этом как о полноценном продукте. В процессе исследований мы параллельно думаем: как это в итоге будут использовать? Это тот сдвиг, который происходит внутри OpenAI сейчас.

Поэтому моё мнение: нас ждёт очень мощная волна апгрейдов моделей. Только глядя на дорожную карту этого года, я уже очень воодушевлён — можно сделать очень многое.

Параллельно мы очень прицельно закрываем «последнюю милю» доступности.

Alex:
С 2022 года OpenAI была бесспорным лидером в этой сфере. Очевидно, теперь конкуренция — это уже не только соревнование по результатам тестов. Вы сами только что сказали «мы догнали».

А как меняется атмосфера внутри компании? То есть теперь это действительно выглядит как прямое соперничество — не как раньше, когда ощущалось, что вы значительно опережаете в продуктах вроде ChatGPT.

Некоторые внешние сообщения тоже показывают эту перемену. Например, внутри компании проводили встречи, где подчёркивали, что у OpenAI больше нет «побочных задач»: все должны сфокусироваться на основном направлении. Так как именно изменились внутренние условия и атмосфера?

Greg Brockman:
Я скажу так: лично для меня самые тревожные моменты в OpenAI наступили как раз после релиза ChatGPT.

Я помню, что тогда на корпоративной праздничной вечеринке витала атмосфера «мы победили». У меня никогда не было ощущения такого рода. Моя реакция была: нет, мы не такие люди; мы как раз на стороне, которая отстаёт.

Причём так и было. Конкуренты в этой области в основном — это уже созданные большие компании: у них больше денег, больше людей, больше данных. Почти все ресурсы были более обеспечены.

Так почему OpenAI всё ещё участвует в конкуренции? В какой-то степени ответ — в том, что мы никогда не чувствовали, что нам можно расслабиться. Мы постоянно считали себя претендентами.

На самом деле, для меня даже полезно видеть, что рынок начинает реально показывать такой конкурентный расклад: что появляются и другие игроки, и у них тоже получается. Это, как мне кажется, здорово.

Потому что, как я думаю, нельзя вечно держать внимание «прибитым» к конкурентам. Если вы только смотрите, где они сейчас, то когда вы доберётесь туда, они уже уйдут дальше.

А мне кажется, в последние периоды происходило наоборот: многие смотрели на то место, где мы находимся, а мы могли продолжать двигаться вперёд. Это, наоборот, дало внутреннюю согласованность и ощущение единства.

Раньше я уже говорил: мы почти считали «исследования» и «деплой» двумя отдельными вещами. А сейчас мы действительно хотим их объединить. Для меня это очень здорово.

Поэтому я бы сказал: текущий этап — это не то, что я думаю «мы когда-то точно выигрывали без шансов», или что мы внезапно в кризисе. Знаете, как внешние оценивают тебя — обычно это не так хорошо, как они говорят, но и не так плохо, как они иногда утверждают.

Я думаю, что в целом у нас очень стабильная ситуация. В основной части — разработке моделей — у меня очень высокая уверенность в нашей дорожной карте и в том, какие исследования мы уже начали и продолжаем. А на продуктовой стороне я вижу очень хорошую энергию: все собираются вместе, чтобы действительно вынести эти вещи на рынок и представить миру.

Alex:
Вы уже несколько раз упоминали, что впереди будут очень сильные новые модели. Так что именно это будет?

В сообщении The Information сказано, что вы уже завершили «предтренировку Spud». А Сэм Альтман говорил сотрудникам OpenAI, что через несколько недель они увидят очень сильную модель. Это было несколько недель назад. Тогда команда внутри компании считала, что она даже может реально ускорить экономику, и что прогресс идёт быстрее, чем многие ожидали.

Так что такое «Spud»?

Greg Brockman:
Это очень хороший вариант модели. Но, как мне кажется, важнее не один конкретный релиз.

Наш процесс разработки примерно такой: сначала предтренировка, то есть создание нового базового фундамента модели. А дальше любые дальнейшие улучшения строятся поверх этого базового варианта. И на этом этапе обычно требуется очень много усилий от многочисленных команд внутри компании. На самом деле, за последние 18 месяцев я большую часть времени сам провёл именно здесь: в основном вокруг GPU‑инфраструктуры, чтобы поддержать команды, отвечающие за тренировочные фреймворки, и чтобы действительно запустить эти масштабные тренировочные задачи.

Дальше идёт этап обучения с подкреплением. То есть AI, который уже выучил много знаний о мире, начинает реально применять их.

Затем — посттренинг. На этом этапе вы на практике учите его: хорошо, ты уже умеешь решать задачи — теперь потренируйся во множестве разных контекстов.

И наконец, есть этап «последней мили» про поведение и полезность.

Поэтому я рассматриваю Spud как новую базу, новый фундамент предтренировки. И на этой платформе, если так можно сказать, приблизительно около двух лет наших исследований начинают давать результат. Это будет очень воодушевляюще.

Я думаю, что на внешней стороне в итоге почувствуют рост возможностей «в целом». Но для меня это никогда не было вопросом «вышла одна версия — и всё». Потому что когда этот релиз выйдет, он будет лишь ранней версией тех дальнейших улучшений, которые мы продолжим делать. Мы продолжим делать больше на каждом этапе процесса улучшений.

Поэтому я считаю, что сейчас мы больше похожи на то, как будто у нас есть движок прогресса, который продолжает разгоняться. А Spud — это просто один из узлов на этом пути.

Alex:
И как вы думаете, что он сможет сделать такого, чего модели сегодня ещё не могут?

Greg Brockman:
Я думаю, он сможет решать более сложные задачи и станет более тонким в понимании. Он будет лучше понимать инструкции и лучше понимать контекст.

Иногда люди говорят про ощущение под названием «big model smell» — то есть когда модель действительно умнее и способнее, вы это ощущаете довольно явно. Она лучше следует вашим намерениям, лучше попадает в ваши потребности.

Когда вы задаёте вопрос, а AI как будто не понял, что вы имели в виду — это чувство сейчас всё ещё разочаровывает. Ты невольно думаешь: это должно было получиться. Он же должен был сам разобраться.

Поэтому я бы сказал, что в каком-то смысле это будет накопление множества «малых изменений», которые в итоге дадут «качественный скачок». С одной стороны, по всем метрикам будет много улучшений. С другой стороны, появятся и совершенно новые сценарии: раньше вы могли избегать использования AI из-за его недостаточной надёжности, а теперь вы будете применять его без раздумий.

Я думаю, это будет всеобъемлющее изменение. Особенно интересно мне увидеть, как он будет продолжать поднимать верхнюю границу возможностей. Мы уже видели его результативность в таких сценариях, как физические исследования. Я думаю, дальше он сможет решать больше открытых задач и преодолевать более длинные временные горизонты.

И одновременно мне интересно, как он поднимет нижнюю границу возможностей — то есть насколько бы ни была ваша задача, он станет намного полезнее по сравнению с сегодняшним уровнем.

Alex:
Но обычным пользователям иногда бывает не так легко почувствовать эту разницу. Например, перед релизом GPT-5 уже было много ажиотажа и ожиданий. Но когда он реально появился, первые реакции публики в некоторой степени были разочаровывающими. Потом люди постепенно поняли: в конкретных задачах он на самом деле очень силён.

А для следующего поколения моделей вы считаете, что улучшения будут заметны в основном в каких-то конкретных профессиональных сценариях, или это станет достаточно прямым, универсальным улучшением для всех?

Greg Brockman:
Мне кажется, история будет похожей. После релиза всегда найдутся люди, которые с первого же запуска скажут: это просто день и ночь по сравнению с тем, что я видел раньше. Но также будут сценарии, где узкое место не в «интеллекте». Если просто сделать модель умнее, пользователь может не сразу заметить разницу именно там.

Но со временем, я думаю, все всё равно почувствуют изменения. Потому что реально меняется то, насколько сильно вы начинаете зависеть от этой системы.

Если вы подумаете о том, как мы сейчас взаимодействуем с AI, у каждого в голове есть психологическая модель «что он умеет». Эта модель меняется не быстро. Обычно осознание приходит с опытом: он иногда внезапно выполняет что-то настолько удивительное, что вы резко понимаете: оказывается, он умеет и это, и я раньше даже не думал об этом.

Например, в сценариях получения медицинской информации мы уже видели подобное. У меня есть друг: он использовал ChatGPT, чтобы разобраться в разных вариантах лечения его рака. Врачи заранее сказали ему: это поздняя стадия, и уже ничего сделать нельзя. Но он с помощью ChatGPT изучил много разных подходов и в итоге действительно нашёл вариант лечения.

Подобные случаи, по сути, зависят от того, что у вас уже есть какое-то доверие к способности AI помогать в этом сценарии. Тогда вы готовы вкладывать столько времени и усилий, чтобы добывать ценность из системы.

Поэтому я думаю, дальше в любых подобных сценариях станет очевиднее для всех: AI поможет вам именно в этой задаче.

Так что это и усиление технологии, и изменение того, как мы сами понимаем технологию — и наше понимание постепенно догоняет её реальные возможности.

Alex:
То есть вы всё сильнее начнёте на неё полагаться. Внутри OpenAI вы ещё разрабатываете автоматизированного AI‑исследователя, который, как говорят, выйдет этой осенью. Но что это такое конкретно?

Ранний этап «взлёта» ИИ

Greg Brockman:
Я думаю, что в целом мы сейчас находимся в ранней стадии технологического взлёта.

Alex:
А что означает «взлёт»?

Greg Brockman:
Взлёт — это когда ИИ продолжает становиться сильнее, двигаясь по экспоненциальной кривой. И часть причины в том, что мы уже можем использовать AI, чтобы помогать улучшать сам AI. Поэтому и весь цикл разработки ускоряется.

Но я думаю, что «взлёт» — это не только про технологию. Это ещё и про высвобождение влияния в реальном мире. Многие технологические развития

ALEX-6,4%
Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Закрепить