Вычислительные мощности на пределе: Google незаметно ввел лимит на использование Gemini для Meta.

robot
Генерация тезисов в процессе

Конфликт спроса и предложения в инфраструктуре искусственного интеллекта обостряется среди ведущих мировых технологических компаний. По данным осведомленных источников, Google около марта этого года уведомила Meta, что не может полностью удовлетворить ее потребности в вычислительных мощностях Gemini, и ввела лимит на использование для этой социальной медиа-гиганта — даже крупнейший в мире поставщик AI-услуг испытывает трудности с удовлетворением стремительно растущего спроса на вычислительные ресурсы.

Согласно сообщению Financial Times, упомянутые ограничения до сих пор не сняты, что привело к сбоям и задержкам в ряде внутренних AI-проектов Meta. В результате Meta потребовала от сотрудников повысить эффективность использования AI-вычислительных мощностей и внедрила внутренний режим экономии AI-токенов. Google и Meta отказались комментировать эту ситуацию.

Это вынуждает Google ускорить расширение мощностей. В начале этого месяца Google заключила с SpaceX Илона Маска соглашение об аренде вычислительных мощностей на сумму 920 миллионов долларов в месяц. Генеральный директор Google Сундар Пичаи на конференции по итогам первого квартала этого года признал: «В последнее время мы действительно сталкиваемся с ограничениями в вычислительных мощностях; если бы мы могли удовлетворить спрос, доходы облачного бизнеса были бы выше».

Meta не единственная. Многочисленные осведомленные источники отмечают, что другие корпоративные клиенты Google также сталкиваются с различными ограничениями, но Meta пострадала больше всех из-за исключительно большого объема спроса. Этот инцидент отражает взрывной рост рабочих нагрузок AI-инференции, который стал одним из крупнейших вызовов для всей отрасли.

Узкое место в вычислительных мощностях продолжает давить, крупные клиенты страдают в первую очередь

Хотя крупные технологические компании уже вложили десятки миллиардов долларов в чипы, дата-центры и электроснабжение, предложение AI-вычислений все еще не поспевает за ростом спроса.

Доход облачного бизнеса Google в первом квартале впервые превысил 20 миллиардов долларов, а объем накопленных, но еще не выполненных облачных контрактов почти удвоился по сравнению с предыдущим кварталом, превысив 460 миллиардов долларов. Пичаи ясно дал понять, что ограничения в вычислительных мощностях сохранятся в ближайшее время.

В этом контексте Meta пострадала особенно сильно. По словам осведомленных источников, именно высокий интенсивный спрос со стороны крупных корпоративных клиентов, таких как Meta, напрямую подтолкнул Google к ускоренному поиску внешних источников вычислительных мощностей. С массовым внедрением чат-ботов, помощников по программированию и AI-агентов, рабочие нагрузки инференции — то есть вычислительные ресурсы, потребляемые при выполнении задач в реальных приложениях после завершения обучения модели — становятся ключевым узким местом отрасли.

Внутренние проекты Meta заблокированы, ускорение перехода на собственные модели

Meta широко использует Gemini внутри компании для проверки безопасности платформы (включая выявление мошеннического контента и удаление вредоносной информации), обслуживания клиентов и рекламных чат-ботов, а также для некоторых внутренних рабочих процессов и разработки кода, одновременно используя другие модели, такие как Claude от Anthropic.

По словам осведомленных источников, Meta первоначально выбрала Gemini, потому что он превосходил собственную модель Llama с открытым исходным кодом. Однако с ужесточением ограничений на вычислительные мощности Meta ускоряет переход на собственные модели. Многочисленные источники сообщают, что Meta недавно начала активно продвигать свою новую модель Muse Spark, которая, как считается, по производительности уже может конкурировать с Gemini, что помогает снизить зависимость от внешних моделей.

Генеральный директор Meta Марк Цукерберг ранее постоянно увеличивал инвестиции в AI-таланты и инфраструктуру, стремясь к созданию того, что он называет «личным суперинтеллектом». В отличие от Google, у Meta нет облачного бизнеса, и она ускоряет строительство собственной сети дата-центров, пообещав к 2028 году инвестировать в США в общей сложности 600 миллиардов долларов.

Google расширяется через SpaceX, отрасль ищет выход

Перед лицом давления на вычислительные мощности Google в этом месяце подписала с SpaceX соглашение об аренде вычислительных мощностей на сумму 920 миллионов долларов в месяц, чтобы восполнить пробелы в инфраструктуре. AI-лаборатория Anthropic также заключила аналогичное соглашение с SpaceX в прошлом месяце.

Тот факт, что Google ввела ограничения для Meta, предоставляет редкую возможность заглянуть в реальное давление, с которым сталкиваются ведущие мировые поставщики AI-услуг при распределении вычислительных мощностей. В настоящее время узкие места в инфраструктуре всей AI-отрасли переходят от обучения к инференции, и разрешение противоречия между спросом и предложением по-прежнему зависит от реализации нового раунда крупномасштабных капиталовложений.

Предупреждение о рисках и отказ от ответственности

        Рынок сопряжен с рисками, инвестиции требуют осторожности. Данная статья не является индивидуальной инвестиционной рекомендацией и не учитывает особые инвестиционные цели, финансовое положение или потребности отдельных пользователей. Пользователи должны учитывать, соответствуют ли любые мнения, точки зрения или выводы в данной статье их конкретной ситуации. Инвестиции на основе данной статьи осуществляются на собственный риск.
Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Закреплено