Фьючерсы
Доступ к сотням фьючерсов
CFD
Золото
Одна платформа мировых активов
Опционы
Hot
Торги опционами Vanilla в европейском стиле
Единый счет
Увеличьте эффективность вашего капитала
Демо-торговля
Введение в торговлю фьючерсами
Подготовьтесь к торговле фьючерсами
Фьючерсные события
Получайте награды в событиях
Демо-торговля
Используйте виртуальные средства для торговли без риска
CFD
Деривативы CFD на акции США
Акции США
Доступ к реальным акциям США и ETF
Акции Гонконга
Торгуйте качественными акциями, котирующимися в Гонконге
Корейские акции
SK Hynix
Торгуйте реальными корейскими акциями и инвестируйте в популярные активы
Фьючерсы на акции
Высокое кредитное плечо, круглосуточная торговля
Токенизированные акции
Обеспечено реальными акциями
IPO Access
Откройте полный доступ к глобальным IPO акций
GUSD
Создать GUSD для получения доходности казначейских RWA
Мероприятия, связанные с акциями
Торгуйте популярными акциями и получайте щедрые эирдропы
Запуск
CandyDrop
Собирайте конфеты, чтобы заработать аирдропы
Launchpool
Быстрый стейкинг, заработайте потенциальные новые токены
HODLer Airdrop
Удерживайте GT и получайте огромные аирдропы бесплатно
IPO Access
Откройте полный доступ к глобальным IPO акций
Alpha Points
Торгуйте и получайте аирдропы
Фьючерсные баллы
Зарабатывайте баллы и получайте награды аирдропа
Инвестиции
Simple Earn
Зарабатывайте проценты с помощью неиспользуемых токенов
Автоинвест.
Автоинвестиции на регулярной основе.
Бивалютные инвестиции
Доход от волатильности рынка
Мягкий стейкинг
Получайте вознаграждения с помощью гибкого стейкинга
Криптозаймы
0 Fees
Заложите одну криптовалюту, чтобы занять другую
Центр кредитования
Единый центр кредитования
Рекламные акции
Промоакции
Участвуйте и получайте награды
Реферал
20 USDT
Приглашайте друзей за бонусы
Партнерская программа
Эксклюзивные комиссионные
Gate Booster
Растите влияние и получайте аирдроп
Анонсы
Обновления в реальном времени
Блог Gate
Статьи о криптоиндустрии
VIP-услуги
Огромные скидки на комиссии
Управление активами
Универсальное решение для управления активами
Институциональный
Крипто-решения для бизнеса
Разработчикам (API)
Подключение к экосистеме приложений Gate
Внебиржевые банковские переводы
Ввод и вывод фиатных денег
Брокерская программа
Щедрые механизмы скидок API
AI
Gate AI
Ваш универсальный AI-ассистент для любых задач
Gate AI Bot
Используйте Gate AI прямо в вашем социальном приложении
GateClaw
Gate Синий Лобстер — готов к использованию
Gate for AI Agent
AI-инфраструктура: Gate MCP, Skills и CLI
Gate Skills Hub
Более 10 тыс навыков
От офиса до трейдинга: единая база навыков для эффективного использования ИИ
Восемь авторов Transformer спустя девять лет: Google ни одного не удержал.
18 июня один из соавторов статьи о Transformer, Ноам Шазир, объявил в X об уходе из компании и присоединении к OpenAI. Два дня спустя, лауреат Нобелевской премии по химии 2024 года и руководитель команды AlphaFold, Джон Джампер, также объявил об уходе из Google DeepMind в Anthropic.
Две новости обрушились одна за другой, вызвав сильную реакцию на рынке капитала: акции материнской компании Google, Alphabet, упали более чем на 7%, а рыночная капитализация испарилась более чем на 300 миллиардов долларов. Многие аналитические агентства связывают эту распродажу с «утечкой кадров». Аналитик D.A. Davidson, Гил Лурия, прямо заявил, что уход Шазира в OpenAI и Джампера в Anthropic, их последовательные увольнения, заставили рынок беспокоиться о том, что Google проигрывает битву за таланты в сфере ИИ.
Уход Шазира особенно примечателен — это уже его второй уход из Google.
В 2021 году, недовольный отказом компании публично выпустить чат-бота, над которым он руководил, он ушел и основал Character.AI; в августе 2024 года Google потратил примерно 2,7 миллиарда долларов на приобретение лицензии на технологию Character.AI, попутно вернув его в DeepMind, назначив вице-президентом по инженерии проекта Gemini и совместным руководителем проекта с Джеффом Дином. Менее чем через два года он снова ушел, на этот раз к заклятому врагу, OpenAI.
На данный момент все восемь соавторов статьи, опубликованной девять лет назад под названием «Attention Is All You Need», покинули Google.
Пользователь Tyler Maran создал изображение, показывающее их нынешние места назначения, и оно было бешено распространено в социальных сетях.
Однако это изображение, возможно, скоро устареет. Всего за последние два дня на рынке появились слухи, что Nvidia тихо переманивает основную команду Essential AI, включая одного из авторов статьи о Transformer, соучредителя и генерального директора Essential AI, Ашиша Васвани. На момент подготовки материала ни Nvidia, ни Essential AI официально не отреагировали на это.
Пользуясь случаем, мы можем полностью составить обзор карьеры этих восьми человек, называемых «отцами Transformer», за последние девять лет, а также их истинное нынешнее местонахождение.
Следует отметить, что порядок авторов статьи «Attention Is All You Need» был случайным. В сноске к статье четко указано: Все авторы внесли равный вклад, порядок случайный, поэтому не существует так называемого «первого автора» или «ответственного автора». Эта статья также представляет этих восьмерых в порядке подписи оригинальной статьи.
«Начало всего»: Восемь нерадивых сотрудников Google
Чтобы понять их нынешнюю судьбу, нужно вернуться в 2017 год. В то время основным подходом в области машинного перевода были рекуррентные нейронные сети (RNN), которые должны были обрабатывать предложения слово за словом, как очередь на однополосной дороге, что не позволяло проводить параллельные вычисления и делало обучение медленным и дорогим.
Восемь человек из Google Brain решили попробовать почти дерзкую идею: полностью отказаться от рекуррентной структуры, оставив только «механизм внимания», чтобы модель могла видеть все предложение целиком и сама решать, на какие слова обращать больше внимания. Название статьи, «Attention Is All You Need», является отсылкой к песне The Beatles «All You Need Is Love» и позже стало моделью для подражания для многих заголовков статей.
Раздел о вкладе авторов в краткой форме фиксирует, что именно сделал каждый:
· Якоб Ушкорейт первым предложил заменить рекуррентные структуры самовниманием и руководил ранней проверкой этой идеи;
· Ашиш Васвани вместе с Ильей Полосухиным спроектировал и реализовал первоначальную модель Transformer, участвуя практически во всех этапах проекта;
· Ноам Шазир предложил масштабированное точечное произведение внимания, механизм многоголового внимания и безпараметрический способ представления позиций, будучи еще одним человеком, который был вовлечен практически во все детали;
· Ники Пармар в первоначальном коде и более позднем фреймворке tensor2tensor разработала, реализовала и отладила бесчисленное количество вариантов модели;
· Лион Джонс также опробовал множество новых вариантов модели и отвечал за первоначальную кодовую базу, оптимизацию производительности вывода и визуализацию;
· Лукаш Кайзер и Эйдан Н. Гомес потратили бесчисленное количество дней и ночей на создание различных модулей tensor2tensor, замену ранней кодовой базы, что значительно повысило эффективность экспериментов и исследований.
Это описание также косвенно раскрывает деталь: хотя порядок авторов статьи был случайным, Ушкорейт, Васвани, Полосухин и Шазир, очевидно, играли более центральную роль на уровне архитектуры, в то время как Пармар, Джонс, Кайзер и Гомес взяли на себя основную работу по инженерной реализации и построению системы — это также является ранним примечанием к различиям в характере и специализации, которые позже привели восьмерых к разным путям.
Само название «Transformer» также имеет свою историю. Ушкорейту понравилось произношение этого слова, поэтому команда внутренне называла себя «Team Transformer», а на обложках ранних дизайнерских документов были изображены шесть персонажей из мультсериала «Трансформеры».
С момента публикации статья была процитирована более 260 000 раз, что делает ее одной из самых цитируемых статей 21 века.
Ашиш Васвани
Васвани родился в 1986 году, индиец. В 2002 году он получил степень бакалавра наук в области компьютерных наук в Бихаре, Индия (BIT Mesra), затем уехал в США и учился в Университете Южной Калифорнии под руководством Дэвида Чанга, защитив докторскую диссертацию по статистическому машинному переводу и нейросетевому языковому моделированию. После получения докторской степени он проработал два года компьютерным ученым в Институте информатики Университета Южной Калифорнии, а в 2016 году официально присоединился к Google Brain в качестве научного сотрудника, где проработал до 2021 года.
Согласно описанию вклада авторов в статье, Васвани вместе с Ильей Полосухиным спроектировал и реализовал первоначальную модель Transformer, будучи одним из ключевых деятелей, «участвовавших почти во всех этапах проекта».
Покинув Google, Васвани в 2021 году вместе с Ники Пармар, бывшим вице-президентом по инженерии OpenAI Дэвидом Луаном и другими основал Adept AI, где стал главным научным сотрудником. Целью было создание «модели поведения», способной автономно выполнять операции в любом программном обеспечении.
Adept привлекла более 400 миллионов долларов, оценка составляла около 1 миллиарда долларов, но продукт так и не был запущен, и в команде возникли разногласия. Васвани и Пармар рано приняли решение выйти — его срок полномочий главного научного сотрудника в Adept закончился в ноябре 2022 года.
В начале 2023 года Васвани и Пармар снова объединились, чтобы основать Essential AI, где он стал генеральным директором. Компания привлекла стратегические инвестиции от Google, Nvidia и AMD: начальный раунд в 8,3 миллиона долларов возглавил Thrive Capital, раунд A на 56,5 миллиона долларов в конце 2023 года возглавил March Capital, с участием Google, Nvidia, AMD, KB Investment, Franklin Templeton и других.
В начале 2026 года компания завершила раунд B на 175 миллионов долларов, возглавляемый Lightspeed Venture Partners, с участием Thrive Capital. Оценка достигла 10 миллиардов долларов, официально став единорогом.
В конце 2025 года компания выпустила первую серию открытых моделей Rnj-1 (названных в честь индийского математика Сринивасы Рамануджана).
Однако всего за последние два дня ветер резко переменился. Сообщается, что Nvidia вербует основную команду Essential AI, включая самого Васвани, который в будущем будет участвовать в разработке открытой модели Nemotron от Nvidia.
Источники сообщили, что причина вполне прагматична: Essential AI сталкивается с трудностями в привлечении финансирования, а переманивание Васвани и команды из лагеря конкурента Nvidia, AMD (AMD была одним из ранних стратегических инвесторов Essential AI, а компания долгое время полагалась на графические процессоры AMD), само по себе является выгодной сделкой.
Несколько исследователей Essential AI (включая Алока Трипати и Саураба Шриваставу) уже обновили свои данные в LinkedIn, указав, что присоединились к Nvidia. Однако на данный момент ни Nvidia, ни Essential AI официально не подтвердили эту новость.
Ноам Шазир
Шазир родился в 1976 году в Филадельфии, ортодоксальный иудей; его отец, Дов Шазир, был инженером и учителем математики, а сестра получила звание раввина от Еврейского колледжа. Он проявил выдающиеся способности в юности, в 1994 году в составе команды США участвовал в Международной математической олимпиаде и завоевал золотую медаль, затем поступил в Университет Дьюка на факультет математики и компьютерных наук, получив стипендию памяти Энгьера Б. Дьюка, и побеждал в математических конкурсах Putnam.
В 2000 году Шазир присоединился к Google, его ранней известной работой было исправление функции автозамены в поиске Google.
Согласно описанию вклада авторов в статье о Transformer, он предложил масштабированное точечное произведение внимания, механизм многоголового внимания и безпараметрический способ представления позиций, будучи, помимо Васвани и Полосухина, «почти вовлеченным во все детали» человеком.
После совместного написания статьи о Transformer в 2017 году он вместе с коллегой Дэниелом Де Фрейташем создал чат-бота Meena, но Google из-за осторожности не выпустил его публично. В 2021 году они решили уйти из компании и основали Character.AI, которая привлекла более 150 миллионов долларов от a16z и других, создав популярное приложение для ролевых чатов.
В августе 2024 года произошел поворот: Google заключил лицензионное соглашение с Character.AI на сумму, по сообщениям, до 2,7 миллиарда долларов. Шазир и Де Фрейташ вместе с небольшой группой коллег вернулись в Google DeepMind. Он был назначен вице-президентом по инженерии и совместно с Джеффом Дином и Ориолем Виньялсом руководил проектом Gemini.
Поскольку он владел примерно 30-40% акций Character.AI, эта сделка позволила ему получить личные средства в размере, по оценкам, от 750 миллионов до 1 миллиарда долларов. В 2026 году он был избран членом Национальной инженерной академии США, его карьера казалась на подъеме.
Однако всего несколько месяцев спустя он снова решил уйти, на этот раз в OpenAI, где, как сообщается, он будет отвечать за направление, называемое «архитектурные исследования», как раз в период, когда OpenAI набирает персонал для выхода на IPO (компания 8 июня тайно подала заявку S-1 в Комиссию по ценным бумагам и биржам США, слухи об оценке достигают 852 миллиардов долларов).
Генеральный директор OpenAI Сэм Альтман редко публично заявлял: «С первого дня основания OpenAI он был одним из тех, с кем я больше всего хотел работать», добавив, что этот найм «вынашивался целых десять лет».
Для Google это оказался дорогостоящий «неудавшийся выкуп»: человек, которого вернули за 2,7 миллиарда долларов два года назад, теперь перешел к главному конкуренту, и это стало одной из прямых причин резкого падения акций Google на этой неделе.
Ники Пармар
Пармар родилась в индийском городе Пуна, окончила бакалавриат в Пуна Институт компьютерных технологий (Pune Institute of Computer Technology) по специальности «Информационные технологии». Во время учебы она заинтересовалась искусственным интеллектом и машинным обучением благодаря онлайн-курсам Эндрю Нга и Питера Норвига, затем уехала в США для получения степени магистра компьютерных наук в Университете Южной Калифорнии, где под руководством профессора Мортезы Дегани исследовала социальные науки с помощью методов машинного обучения.
В 2015 году Пармар присоединилась к Google Research в качестве инженера-программиста, а в 2017 году перешла в Google Brain в качестве научного сотрудника-программиста — по сообщениям, она была самым молодым и единственным исследователем без докторской степени в команде Google Brain в то время.
Согласно описанию вклада авторов в статье, она в первоначальном коде и более позднем фреймворке tensor2tensor разработала, реализовала и отладила бесчисленное количество вариантов модели. После публикации статьи она продолжила расширять область применения Transformer за пределы языка, участвуя в исследованиях по распространению механизма самовнимания на генерацию изображений и компьютерное зрение.
В 2021 году Пармар покинула Google и вместе с Ашишем Васвани, Дэвидом Луаном и другими основала Adept AI, где стала техническим директором. Как и Васвани, она рано вышла из Adept, а в начале 2023 года вместе с Васвани снова основала Essential AI, продолжив быть соучредителем.
Однако она не дождалась более позднего раунда B и статуса единорога Essential AI. В конце 2024 года Пармар тихо покинула Essential AI и присоединилась к Anthropic, окончательно объявив об этом в феврале 2025 года. Она написала в X: «Сегодня, как и обычно, подходящий день, чтобы поделиться: я присоединилась к Anthropic в прошлом декабре».
Впоследствии она участвовала в разработке Claude 3.7 Sonnet — одного из самых важных релизов моделей в истории Anthropic. Сейчас она является членом технического персонала (Member of Technical Staff) в Anthropic, сосредоточившись на исследованиях передовых возможностей и направлениях обучения с подкреплением.
Два когда-то неразлучных соавтора, дважды сооснователи стартапов, в итоге пошли по двум совершенно разным путям: Пармар более чем за год тихо ушла, спокойно влившись в ведущую лабораторию; в то время как Васвани решил продолжать продвигать Essential AI, пока на этой неделе его не перехватила протянутая рука конкурента.
Якоб Ушкорейт
Ушкорейт родился в семье лингвистов. Его отец, Ганс Ушкорейт, является известным компьютерным лингвистом. Когда сын выдвинул гипотезу о том, что «одного только внимания достаточно», даже отец сомневался. Ушкорейт получил докторскую степень в Берлинском техническом университете и позже дослужился до звания «выдающегося ученого» (Distinguished Scientist) в Google Brain.
Согласно описанию вклада авторов в статье, именно Ушкорейт первым предложил заменить рекуррентные нейронные сети механизмом самовнимания и руководил ранней проверкой этой идеи — семена этой гипотезы были заложены еще в статье 2016 года «Разложимая модель внимания», написанной им совместно с Анкуром Парихом, Оскаром Тэкстрёмом и Дипанжаном Дасом.
Название «Transformer» также было выбрано потому, что ему понравилось произношение этого слова; команда внутренне называла себя «Team Transformer», а на обложках ранних дизайнерских документов были изображены шесть персонажей из мультсериала «Трансформеры».
В конце 2020 года AlphaFold2 от DeepMind доказал, что модели типа Transformer могут решать такие «Святой Грааль биологии» задачи, как сворачивание белков. Он все отчетливее понимал, что глубокое обучение еще не смогло по-настоящему изменить биологию из-за нехватки не алгоритмов, а данных. «Это почти стало моральным долгом», — вспоминал он позже.
Поэтому в 2021 году он вместе с профессором биохимии Стэнфордского университета и разработчиком известной игры по конструированию РНК Eterna, Риджу Дасом, основал Inceptive. Штаб-квартира компании расположена в Беркли, исследовательская группа осталась в Берлине — сам он живет в Берлине, сотрудники также распределены по Цюриху, Лондону, Ванкуверу и нескольким городам на восточном побережье США.
Основная идея компании заключается в обратном подходе: не сначала иметь данные, а затем обучать модель, а с помощью роботов и людей массово генерировать новые экспериментальные данные о РНК и затем обучать на них модель.
Inceptive привлекла около 1,2 миллиарда долларов от Nvidia, a16z, Obvious Ventures, Section 32 и других. Последние новости произошли в этом месяце: в начале июня компания Alnylam Pharmaceuticals, пионер в области терапии на основе РНК-интерференции, подписала стратегическое соглашение о сотрудничестве с Inceptive, чтобы с помощью фундаментальных моделей Inceptive ускорить разработку siRNA-кандидатов. Первоначальный взнос составил 30 миллионов долларов, сообщается, что общая потенциальная сумма сделки может достигать около 2 миллиардов долларов.
Ушкорейт заявил в пресс-релизе: «Большинство разработок лекарств по-прежнему основаны на методе проб и ошибок — тестируются тысячи молекул в надежде, что одна из них сработает. Исходная точка Inceptive иная: жизнь подчиняется чрезвычайно сложным законам, которые может выучить только ИИ».
Из восьми авторов он единственный, кто полностью перешел в биотехнологии, и это в точности подтверждает предсказание, оставленное той статьей: потенциал механизма внимания выходит далеко за пределы машинного перевода.
Лион Джонс
Джонс — валлиец, окончил Бирмингемский университет, в 2011 году присоединился к Google в качестве инженера-программиста и проработал там более десяти лет. Он является одним из немногих среди восьми авторов, у кого нет докторской степени, и кто добился успеха благодаря чисто инженерной интуиции.
Согласно описанию вклада авторов в статье, он опробовал множество новых вариантов модели и отвечал за первоначальную кодовую базу, оптимизацию производительности вывода и визуализацию.
Позже он вспоминал тот решающий момент: «Мы тогда только начали пробовать просто отбрасывать некоторые части модели, чтобы посмотреть, насколько ухудшится результат. К удивлению, он стал лучше». Именно в этот момент впервые была подтверждена гипотеза о том, что «рекуррентная структура избыточна».
В 2023 году Джонс вместе с Дэвидом Ха, также выходцем из Google, основал в Токио компанию Sakana AI. «Сакана» по-японски означает «рыба». Ха стал генеральным директором, Джонс — техническим директором, а еще один соучредитель, Рен Ито, — операционным директором.
Сейчас Джонс постоянно проживает в Токио и называет себя в социальных сетях «валлийским исследователем ИИ, живущим в Токио». Исследовательский подход этой компании имеет ярко выраженный антимодный оттенок: вместо того чтобы бездумно наращивать вычислительные мощности и параметры, лучше черпать вдохновение из естественной эволюции, позволяя группе более мелких моделей сотрудничать, как косяк рыб. К числу репрезентативных исследовательских результатов компании относятся Continuous Thought Machine (Машина непрерывного мышления) и проект «AI Scientist» (ИИ-ученый), способный автономно проводить сквозные исследования.
Недавно компания выпустила передовую модель Sakana Fugu.
Sakana AI привлекла в общей сложности 379 миллионов долларов финансирования, включая раунд B, завершенный в марте 2026 года. Одним из инвесторов является Mitsubishi Electric. В марте 2026 года компания также заключила многолетнее соглашение о сотрудничестве с Mitsubishi UFJ Financial Group (MUFG). Последняя планирует использовать технологию Sakana для модернизации своих банковских систем. Сообщается, что это соглашение позволит компании, стоимость которой оценивается примерно в 1,5 миллиарда долларов, выйти на прибыльность в течение года.
Сам Джонс неоднократно выражал скептицизм в отношении чистого «скейлинга».
В марте 2026 года на внутреннем мероприятии банковского сектора он сказал, что текущие исследования в области ИИ сталкиваются с неудобной реальностью: большой приток инвестиций и талантов теоретически должен привести к большему количеству прорывов, но фактический эффект может быть прямо противоположным: инвесторы подталкивают к результатам, конкуренция поощряет первенство, а пространство для «свободного поиска» исследователей, наоборот, сужается.
Он упомянул, что в Sakana всегда сохраняется небольшая часть исследовательской свободы «без KPI», потому что следующий прорыв обязательно произойдет в результате таких долгосрочных вложений без оглядки на последствия — именно так Transformer родился в том офисе Google Brain.
Он также произнес фразу, которую часто цитируют: чтобы новая архитектура действительно заменила Transformer, недостаточно быть «лучше», она должна быть «лучше очевидно, без сомнений».
Эйдан Н. Гомес
Гомес — самый молодой из восьми авторов. На момент публикации статьи он был 20-летним стажером бакалавриата в Google Brain и учился в Университете Торонто на двойной специальности — компьютерные науки и математика.
Согласно описанию вклада авторов в статье, он вместе с Лукашем Кайзером потратил бесчисленные дни и ночи на создание различных модулей фреймворка tensor2tensor, замену ранней кодовой базы, что значительно повысило эффективность экспериментов и исследований. «Я просто хотел понять, как работает механизм внимания», — вспоминал он позже. «Я и представить не мог, что это станет 'архитектурой всего'». После статьи он уехал в Оксфордский университет для получения докторской степени, приостановил обучение ради предпринимательства и официально получил степень доктора только в 2024 году — можно сказать, что он заканчивал учебу, одновременно развивая бизнес.
В 2019 году Гомес вместе с Иваном Чжаном и Ником Фростом основал Cohere, позиционируя компанию как поставщика корпоративных ИИ-услуг, намеренно избегая дорогостоящей гонки за создание потребительских чат-ботов, делая упор на конфиденциальность данных, локальное развертывание и многоязычность. Клиентами являются в основном крупные предприятия и правительства различных стран.
В 2023 году Гомес вошел в список 100 самых влиятельных людей в области ИИ по версии журнала Time, а вместе с двумя соучредителями занял первое место в рейтинге трендовых лидеров в области ИИ по версии журнала Maclean's за тот же год; в апреле 2025 года он был избран в совет директоров компании по производству электромобилей Rivian.
Этот относительно «непривлекательный» подход, тем не менее, позволил компании добиться хороших финансовых показателей: по состоянию на середину 2026 года годовая регулярная выручка Cohere превысила 200 миллионов долларов, увеличившись в 6 раз за последний год, маржа валовой прибыли составляет около 70%, совокупный объем привлеченного финансирования приближается к 1,7 миллиарда долларов, а оценка составляет около 7 миллиардов долларов; в августе 2025 года компания наняла Франсуа Шедвика, участвовавшего в IPO Uber, в качестве своего первого финансового директора, а окно для продажи акций сотрудниками на вторичном рынке уже открывалось. Сам Гомес неоднократно заявлял, что IPO «уже скоро», но на данный момент компания не подавала проспект эмиссии в регулирующие органы.
В последние годы Гомес все больше становится похожим на представителя ИИ в геополитическом смысле. На этой неделе он написал статью для журнала Fortune, призывая страны серьезно отнестись к вопросу «цифрового суверенитета».
В статье прямо упоминается недавнее ужесточение доступа к моделям Anthropic, предупреждая страны, что они не могут «арендовать» свое будущее у нескольких централизованных технологических гигантов, и предлагая создать по-настоящему разнообразную экосистему, позволяющую странам полагаться на разных поставщиков ИИ, сохраняя при этом свои ценности, язык и правовую систему.
Он также публично заявлял, что опасения по поводу «апокалиптических» рисков ИИ преувеличены, и его больше беспокоят реальные риски, такие как автоматическое распространение дезинформации в социальных сетях. Сегодня Гомес говорит не только о самой модели, но и о том, кто имеет право решать, какой ИИ будет использовать весь мир.
Лукаш Кайзер
Кайзер — поляк, его первоначальная академическая подготовка была в области теоретической информатики, такой как логика, теория автоматов, теория алгоритмических моделей и теория игр: он получил двойную степень магистра математики и информатики во Вроцлавском университете, а затем защитил докторскую диссертацию в Рейнско-Вестфальском техническом университете Ахена. После этого он имел постоянную профессорскую должность в Национальном центре научных исследований Франции (CNRS) и Университете Париж 7, занимаясь чисто теоретическими исследованиями в области логики и теории автоматов.
Позже он переключился на прикладные исследования, проработал в Google Brain почти 8 лет, за это время был одним из соавторов TensorFlow, а также публиковал ранние статьи на тему «Может ли активная память заменить внимание» в соавторстве с Сами Бенгио, и «Нейронный GPU для обучения алгоритмам» в соавторстве с Ильей Суцкевером.
Согласно описанию вклада авторов в статье, он вместе с Эйданом Н. Гомесом потратил бесчисленные дни и ночи на создание фреймворка tensor2tensor, что значительно повысило эффективность экспериментов и исследований.
Из восьми авторов он единственный, кто не пошел в предпринимательство, а остался в крупной лаборатории проводить чистые исследования.
В 2021 году он присоединился к OpenAI, когда ChatGPT еще не был выпущен. В OpenAI он участвовал в разработке Codex (который позже стал технологической основой GitHub Copilot) и сопутствующего бенчмарка по программированию HumanEval, а также в исследованиях набора данных по математическим задачам GSM8K. Эта работа рано продемонстрировала, что «позволение модели подумать подольше во время вывода и сделать больше выборок» может значительно повысить точность — это был прообраз более поздней парадигмы моделей рассуждения.
Он также является одним из подписавших технический отчет GPT-4, а позже стал ключевым участником первой модели рассуждений OpenAI, o1 (выпущенной в сентябре 2024 года), считаясь лицом на уровне «руководителя исследований». Затем это продолжилось в o3 и более новые парадигмы рассуждений, вплоть до текущей серии GPT-5.
Недавно он в подкасте MAD Podcast, ведущим которого был Мэтт Терк, сказал, что Transformer математически доказано может решить любую задачу, если позволить модели генерировать достаточное количество промежуточных шагов рассуждений. В некотором смысле, это запоздалый и более точный комментарий к той статье девятилетней давности.
Илья Полосухин
Полосухин родом из Харькова, Украина, получил степень бакалавра прикладной математики и был чемпионом Международной студенческой олимпиады по программированию (ICPC). По его собственным воспоминаниям, после просмотра «Матрицы» в десятилетнем возрасте у него зародился почти навязчивый интерес к искусственному интеллекту. В 2014 году он присоединился к Google, участвовал в исследованиях, связанных с TensorFlow, а также занимался системами машинного чтения и ответов на вопросы.
Согласно описанию вклада авторов в статье, он вместе с Ашишем Васвани спроектировал и реализовал первоначальную модель Transformer, и его часть работы заключалась в основном в проверке эффективности этой архитектуры на задачах машинного перевода.
После публикации статьи он в 2017 году покинул Google и вместе с Александром Скидановым основал изначально называвшуюся NEAR.AI компанию по искусственному интеллекту. Но вскоре они поняли, что создание децентрализованной инфраструктуры может быть более интересным, чем создание моделей, поэтому примерно в 2018 году компания перешла на блокчейн-проект NEAR Protocol.
NEAR использует технологию шардинга под названием Nightshade и предоставляет совместимую с Ethereum сеть второго уровня через Aurora. Основная сеть была официально запущена в 2020 году. На сегодняшний день компания привлекла более 530 миллионов долларов от таких институциональных инвесторов, как a16z, Coinbase, Tiger Global Management, Hashed, Dragonfly Capital.
Сегодня Полосухин пытается снова соединить свои две первоначальные идентичности: в марте 2026 года он заявил СМИ, что «будущие пользователи блокчейна будут ИИ-агентами, а не людьми», и позиционирует NEAR как «расчетный слой» для экономики агентов.
В апреле того же года он публично призвал к созданию более совершенной нормативной базы для работы с автономными ИИ-агентами; он считает, что существующие институты и системы еще не готовы решать проблемы ответственности и системных рисков, связанные с такими системами, и призвал к созданию более четких механизмов подотчетности и надзора «в контуре с человеком».
В настоящее время он постоянно проживает в Португалии. Между двумя идентичностями — «автор основополагающей статьи о LLM» и «руководитель блокчейн-компании стоимостью в миллиарды долларов» — в мире, вероятно, только он обладает обеими одновременно.
Восемь путей, продолжаем исследование
В марте 2024 года на конференции GTC от Nvidia семеро из восьми авторов (Ники Пармар отсутствовала по уважительной причине) впервые появились на одной сцене в качестве группы и дали интервью Дженсену Хуангу.
Дженсен Хуанг сказал: «Все, чем мы сегодня наслаждаемся, можно проследить до того момента.»
В конце диалога он подарил каждому памятную табличку с автографом от суперкомпьютера Nvidia DGX-1 с надписью «Вы изменили мир (You transformed the world)». В ноябре того же года японский фонд C&C присудил премию C&C 2024 года «команде Transformer», состоящей из этих восьми человек. Вместе с ними на сцене получали награду три опытных инженера, исследовавших трансокеанские подводные кабельные технологии. Строители инфраструктуры из двух совершенно разных областей были объединены одной наградой.
Прошло девять лет, и эти восемь жизненных траекторий разошлись настолько, что почти не пересекаются: корпоративный ИИ-сервис в Кремниевой долине, лаборатория эволюционных алгоритмов в Токио, компания молекулярной биологии в Берлине, блокчейн-протокол в Португалии, а также несколько ведущих ИИ-лабораторий, которые все еще перетасовываются на этой неделе.
Но если собрать вместе все, что они говорили за эти годы, обнаружится повторяющееся общее суждение: никто на самом деле не верит, что Transformer станет конечной точкой.
Эйдан Н. Гомес говорит, что миру нужно что-то лучшее, чем Transformer; Лион Джонс говорит, что следующая архитектура должна быть «лучше очевидно, без сомнений», чтобы заменить его; Лукаш Кайзер все еще пытается объяснить на языке математики, насколько далеко эта архитектура, родившаяся девять лет назад, может завести человечество.
Возможно, это самое долговечное наследие той статьи: восемь ее авторов разбросаны по всему миру, но никто из них не перестал искать следующий ответ.
Нажмите, чтобы узнать о вакансиях в BlockBeats
Добро пожаловать в официальное сообщество BlockBeats:
Telegram-канал подписки: https://t.me/theblockbeats
Telegram-чат: https://t.me/BlockBeats_App
Официальный Twitter-аккаунт: https://twitter.com/BlockBeatsAsia