F5 и NVIDIA улучшают экономику AI-фермы с новыми возможностями для ускоренного вывода AI

(MENAFN- Asdaf Новости) ** Дубай – Asdaf News:**

F5 (NASDAQ: FFIV), глобальный лидер в предоставлении и обеспечении безопасности каждого приложения и API, сегодня объявила о расширении возможностей в рамках своего текущего ** сотрудничества**

Расширенная интеграция объединяет ** F5 BIG-IP Next для Kubernetes**

В ИИ-системах токены представляют собой измеримую единицу вывода ИИ — слова, символы или фрагменты данных, которые генерируются и обрабатываются во время инференса. Объем и скорость генерации токенов в конечном итоге определяют пользовательский опыт, эффективность инфраструктуры и выручку на каждый ускоритель.

Поскольку предприятия и провайдеры GPUaaS стремительно монетизируют ИИ и переходят от экспериментов с ИИ к услугам, приносящим выручку, эффективность инфраструктуры стала ключевым показателем. Успех теперь все чаще измеряется не просто развернутой мощностью GPU, а токен-экономикой, стабильной пропускной способностью токенов, временем до первого токена (TTFT), стоимостью токена и выручкой на GPU-ускоритель. Совместное решение F5 и NVIDIA предназначено для непосредственного решения этих показателей.

** Оптимизация токеномики за счет интеллектуальной ИИ-инфраструктуры**

Переход от инференса, ориентированного на приложения, к агентно-управляемым ИИ-процессам требует новых архитектурных подходов для оптимизации пропускной способности токенов и снижения затрат. BIG-IP Next для Kubernetes теперь использует статистику NVIDIA NIM, сигналы времени выполнения Dynamo и телеметрию GPU, чтобы принимать решения о маршрутизации с учетом инференса до выполнения. Сопоставляя рабочие нагрузки с наиболее подходящими ускорителями в режиме реального времени, решение повышает стабильную загрузку при одновременном снижении задержки и повторных вычислений.

«ИИ-инфраструктура больше не сводится просто к доступу к GPU или масштабированию их развертываний. Она эволюционировала в максимизацию экономического результата на каждый ускоритель», — сказал Кунал Ананд, директор по продуктам (Chief Product Officer), F5. «Вместе с NVIDIA мы даем возможность ИИ-фабрикам рассматривать генерацию токенов как измеримый показатель бизнеса. BIG-IP Next для Kubernetes предоставляет необходимый интеллект и механизмы управления для повышения выхода GPU, снижения стоимости токена и масштабирования совместно используемых ИИ-платформ с уверенностью».

** Проверенная эффективность инфраструктуры: структурное улучшение**

Цифры говорят сами за себя. В тестировании, подтвержденном The Tolly Group, BIG-IP Next для Kubernetes, ускоренный NVIDIA BlueField-3 DPUs, обеспечил до 40% роста пропускной способности токенов, на 61% более быстрое время до первого токена (TTFT) и на 34% меньше задержек при обработке общих запросов.

Это не просто постепенные улучшения. Перекладывая сетевые функции, TLS/шифрование, балансировку нагрузки с учетом ИИ и управление трафиком на NVIDIA BlueField-3 DPUs, BIG-IP Next для Kubernetes сохраняет резерв CPU хоста и высвобождает GPU для того, для чего они были созданы: стабильного высокопроизводительного инференса в масштабе. В результате повышается загрузка GPU, снижаются задержки в очередях и увеличивается выход токенов, что обеспечивает более низкую стоимость токена в рамках фиксированного объема инфраструктуры. Критически важно: не требовалось изменений в моделях, поэтому полученные преимущества можно сразу развертывать в существующей ИИ-инфраструктуре ИИ-фабрик. Для предприятий и провайдеров NeoCloud, которые конкурируют по токен-экономике, это разница между инфраструктурой, ограничивающей выход ИИ, и инфраструктурой, которая ускоряет его.

«Ускоренная вычислительная инфраструктура NVIDIA в сочетании с платформой Application Delivery and Security Platform от F5 с учетом ИИ открывает превосходную токеномику ИИ-фабрик — обеспечивая масштабируемый и экономически эффективный инференс без внесения каких-либо изменений в модели», — сказал Кевин Дейерлинг, вице-президент (SVP), Networking, NVIDIA. «Вместе F5 и NVIDIA помогают предприятиям эффективно и экономически целесообразно масштабировать инференс на ИИ-фабриках».

** Создано для агентно-управляемого ИИ и мультиарендных ИИ-платформ**

Современные ИИ-нагрузки все чаще являются агентно-управляемыми, устойчивыми и контекстно-зависимыми. Они требуют интеллектуального контроля трафика, который не может обеспечить традиционная балансировка нагрузки. Расширенное решение BIG-IP Next для Kubernetes теперь может поддерживать:

Маршрутизацию с учетом инференса для агентных ИИ-процессов Интеграцию с NVIDIA DOCA Platform Framework (DPF), чтобы упростить развертывание NVIDIA BlueField DPU и управление их жизненным циклом EVPN-VXLAN с динамическими VRF для безопасной сетевой мультиарендности Интегрированную безопасность, токен-управление и наблюдаемость в средах ИИ в Kubernetes

Эти возможности позволяют предприятиям и провайдерам NeoCloud безопасно совместно использовать инфраструктуру GPU между бизнес-подразделениями или внешними клиентами, сохраняя изоляцию производительности и предсказуемые уровни обслуживания.

** Контрольная плоскость для экономики ИИ-фабрик**

F5 и NVIDIA предоставляют предприятиям проверенные инструменты и лучшие практики для оптимизации инференсной архитектуры. Благодаря этим достижениям BIG-IP Next для Kubernetes позиционируется как стратегическая контрольная плоскость для экономики ИИ-фабрик: управление потреблением токенов, оптимизация потоков трафика и максимизация возврата инвестиций в инфраструктуру.

Вместо того чтобы избыточно выделять ресурсы для компенсации неэффективности, организации теперь могут извлекать большую экономическую ценность из каждого GPU, который уже находится в производственной эксплуатации. Результат — улучшение выручки на GPU, снижение операционных накладных расходов и масштабируемые ИИ-услуги, созданные для устойчивого роста. Объединяя инфраструктурную телеметрию и ускорение DPU от NVIDIA с возможностями интеллектного управления трафиком и безопасности от F5, компании помогают предприятиям превращать ИИ-фабрики в эффективные, монетизируемые платформы, готовые к агентной эпохе.

** Поддерживающие материалы**

** Блог:** ** ИИ-фабрикам нужна интеллектуальная инфраструктура. Новые результаты от The Tolly Group показывают, почему. ** Отчет:** ** Независимое тестирование от Tolly: F5 BIG-IP Next для Kubernetes


MENAFN25032026007116015312ID1110904062

Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Закрепить