NVIDIA выходит на рынок больших моделей ИИ

robot
Генерация тезисов в процессе

Если кто-то спросит, кто главный победитель в эпоху ИИ, ответ почти не вызывает сомнений — NVIDIA. Благодаря дефицитным, продающимся как горячие пирожки H100, компания как продавец лопат во времена золотой лихорадки: наблюдая, как во всем мире ИИ-компании бьются головой о стену, она сама молча и втихую разбогатевает, а рыночная капитализация тем временем неуклонно взлетает до небес. Согласно последним финансовым документам, NVIDIA в ближайшие 5 лет суммарно вложит 26 млрд долларов США, чтобы с размахом продвигать разработку открытых ИИ-моделей с открытым исходным кодом. Это означает, что NVIDIA больше не собирается удовлетворяться ролью продавца лопат, а намерена лично спуститься в шахту за золотом.

Крупные инвестиции

12 марта, согласно финансовым документам, которые NVIDIA подала в Комиссию по ценным бумагам и биржам США (SEC), компания в ближайшие 5 лет суммарно вложит 26 млрд долларов США (около 178,8 млрд юаней) в разработку открытых ИИ-моделей с открытым исходным кодом. NVIDIA также официально запустила стратегическую трансформацию — от «производителя чипов» к «топ-лаборатории полного стека ИИ».

Согласно плану, эти 26 млрд долларов США от NVIDIA направлены не только на разработку одной конкретной модели, а покрывают всю отраслевую цепочку открытых ИИ-моделей. Средства будут постепенно внедряться в течение следующих 18–24 месяцев; первая партия собственных открытых ИИ-моделей должна быть анонсирована самое раннее в конце 2026 — начале 2027 года.

Для сравнения: этот масштаб инвестиций значительно превышает 3 млрд долларов США, которые были потрачены на обучение GPT-4 в OpenAI. А в технологическом плане NVIDIA выбрала «промежуточный путь» с «открытыми весами» (Open-weight). Эта модель находится между полностью закрытым подходом OpenAI и полностью открытым подходом серии Llama под эгидой Meta.

Конкретно говоря, NVIDIA обнародует ключевые параметры (веса) открытой модели, позволит компаниям и разработчикам бесплатно загружать их и запускать на своих устройствах или в частном облаке, а также выполнять дообучение, чтобы удовлетворять потребности предприятий в конфиденциальности данных, кастомизации и контроле затрат. Но данные для обучения модели и код могут быть раскрыты не полностью.

Некоммерческая организация Laude Institute, которая фокусируется на продвижении открытости ИИ, — основатель и специалист по информатике Andy Konwinski — охарактеризовал эти вложения NVIDIA как пронзительный сигнал, фактически как веху. «Они находятся на передовой точке пересечения множества открытых и закрытых проектов в сфере ИИ», — сказал Konwinski. «Это беспрецедентная по масштабу и формах демонстрация их позиции в пользу открытости».

Кроме того, анализ отрасли указывает, что открытая стратегия несет для NVIDIA и более долгосрочное коммерческое значение. Когда NVIDIA будет публиковать свои модели, она раскроет веса и технические детали, что поможет стартапам и исследователям вносить изменения и внедрять инновации на основе ее технической базы. Это способствует формированию сети разработчиков вокруг аппаратной экосистемы NVIDIA, дополнительно усиливая рыночную «липкость» ее чипов.

На уровне OpenAI

С момента публикации первого модели Nemotron в ноябре 2023 года NVIDIA последовательно представила специализированные модели для вертикальных направлений, таких как робототехника, климатическое моделирование и фолдинг белков. Заместитель вице-президента по исследованиям в области глубокого обучения Bryan Catanzaro также сообщил, что NVIDIA недавно завершила предварительное обучение модели с 550 млрд параметров. При разработке базовой модели NVIDIA будет уделять особое внимание передовым многомодальным и мультидоменным моделям, охватывающим язык, код, научные вычисления, агентные сценарии и другие направления.

В последнее время NVIDIA также представила новое поколение открытых крупномасштабных языковых моделей Nemotron 3 Super, созданных специально для корпоративных систем с несколькими агентами. Общее число параметров в модели — 128 млрд (при инференсе активируется только 12 млрд), она нативно поддерживает сверхдлинное окно контекста на 1 млн токенов. В отличие от преобладающей модели доступа через API, в этот раз NVIDIA открыла веса модели, наборы данных для pretraining/post-training и полный план обучения.

128 млрд параметров — примерно соответствует крупнейшей версии GPT-OSS от OpenAI. NVIDIA утверждает, что в комплексной оценке Artificial Intelligence Index Nemotron 3 Super получила 37 баллов, тогда как GPT-OSS — лишь 33.

Стоит отметить, что NVIDIA также признает: отдельные китайские модели набирают больше баллов, чем этот уровень. Помимо этого, NVIDIA заявила, что Nemotron 3 Super участвовала в новом бенчмарке под названием PinchBench — тесте, который специально оценивает способность модели управлять OpenClaw. В этом тесте Nemotron 3 Super заняла первое место.

На техническом уровне NVIDIA раскрыла несколько инновационных методов, используемых при обучении этой модели. Они охватывают архитектуры и техники тренировки, повышающие способность модели к выводу (inference), обработку длинного контекста и способность отвечать через обучение с подкреплением.

Catanzaro заявил: «NVIDIA уделяет разработке открытых моделей гораздо больше внимания, чем прежде, и мы добиваемся значительного прогресса».

На уровне экосистемы NVIDIA уже договорилась о сотрудничестве с ведущими облачными провайдерами и производителями железа — включая Google Cloud Vertex AI, инфраструктуру Oracle Cloud, Dell Technologies, HPE и др. Подключение через Amazon AWS Bedrock и Microsoft Azure также находится в стадии подготовки. Такие компании по разработке программных интеллектуальных агентов, как CodeRabbit, Factory и Greptile, а также организации в области наук о жизни Edison Scientific и Lila Sciences уже объявили, что интегрируют эту модель в свои рабочие процессы с интеллектуальными агентами.

Переопределяя маршрут

Долгое время ключевое преимущество NVIDIA концентрировалось в сфере чипового железа: ее доля на рынке ИИ-чипов превышает 80%, но в части влияния на уровень ИИ-моделей она относительно слабее; ранее стандарты технологий и парадигмы обучения для больших моделей в основном задавали такие компании, как OpenAI и Meta.

На этот раз, когда NVIDIA выходит в поле и самостоятельно разрабатывает топовые открытые модели, ключевая цель — задать технологический маршрут базового уровня для ИИ-моделей, чтобы собственная аппаратная архитектура и стек ПО стали фактическим стандартом для всей отрасли ИИ. Этого NVIDIA планирует добиться, «подтягивая» спрос на вычислительные мощности за счет открытых моделей. Если Nemotron станет основной базовой моделью для ИИ корпоративных интеллектуальных агентов, то для масштабного запуска этой модели все равно будет требоваться GPU-инфраструктура, которая будет опираться на NVIDIA: при продвижении открытости на уровне моделей компания одновременно будет фиксировать спрос на уровне железа.

Финансовые аналитики прогнозируют: если NVIDIA одновременно укрепит свое господство в сегменте железа и сумеет успешно завоевать 10% доли на рынке базовых моделей, это может обеспечить компании до 50 млрд долларов США дополнительной выручки в год в течение трех лет. Bryan Catanzaro заявил, что продвижение развития открытой экосистемы полностью соответствует ключевым интересам NVIDIA. Это масштабное вложение не является слепым следованием моде, а представляет собой стратегический выбор, сделанный после долгих отраслевых исследований и оценок.

Во вторник по местному времени CEO NVIDIA Хуан Жэньсюнь также опубликовал редкий масштабный блог на тему искусственного интеллекта. Это его седьмая публичная статья большого объема с 2016 года; в ней системно раскрывается базовая логика индустрии ИИ, а в тексте Хуан Жэньсюнь определяет «пятислойную архитектуру» ИИ. Он отметил, что индустрия ИИ по-прежнему находится на очень ранней стадии развития: хотя отрасль уже вложила тысячи миллиардов долларов США, реальный потенциал ИИ еще не раскрыт полностью, и в будущем потребуется дальнейшее инвестирование на десятки тысяч миллиардов долларов США, чтобы укрепить базовую инфраструктуру.

Хуан Жэньсюнь подчеркнул: ИИ стал одной из самых мощных сил, формирующих современный мир. Это не просто один-единственный умный прикладной софт или модель, а жизненно важная инфраструктура — как электричество и интернет. ИИ работает на реальном железе, энергии и экономической базе: он способен «поглощать» сырье и преобразовывать его в масштабируемый интеллект. В будущем каждая компания будет использовать ИИ, и в каждом государстве будет строиться ИИ-инфраструктура.

Относительно опасений по поводу занятости, которые возникают на фоне развития ИИ, Хуан Жэньсюнь считает, что ИИ не только не сократит рабочие места, а напротив — создаст множество новых возможностей трудоустройства. Особенно в сфере инфраструктуры и квалифицированных профессий. Под строительство ИИ-инфраструктуры требуется крайне много рабочей силы: для ИИ-заводов нужны электрики, сантехники, сталевары, специалисты по сетям, монтажники и операторы и т. д. Это рабочие места высокой квалификации с высокой оплатой, и на них сейчас наблюдается дефицит предложения. ИИ заполняет огромный дефицит рабочей силы в глобальном масштабе — например, для водителей грузовиков, медсестер, бухгалтеров и др., а не производит безработицу.

Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Закрепить