F5 та NVIDIA покращують економіку AI-фабрики з новими можливостями для прискореного AI-виведення

(MENAFN- Asdaf Новини) ** Дубай – Asdaf News:**

F5 (NASDAQ: FFIV), глобальний лідер у доставці та захисті кожного застосунку й API, сьогодні оголосила про розширені можливості у своїй триваючій ** співпраці**

Розширена інтеграція поєднує ** F5 BIG-IP Next для Kubernetes**

У системах ШІ токени відображають вимірювану одиницю результату ШІ — слова, символи або фрагменти даних, що генеруються та обробляються під час інференсу. Обсяг і швидкість генерації токенів зрештою визначають користувацький досвід, ефективність інфраструктури та дохід на кожен акселератор.

Оскільки підприємства та провайдери GPUaaS змагаються, щоб монетизувати ШІ та перейти від експериментів з ШІ до сервісів, що генерують дохід, ефективність інфраструктури стала ключовим показником. Успіх дедалі частіше вимірюють не просто наявною місткістю GPU, а економікою токенів, стабільною пропускною здатністю токенів, часом до першого токена (TTFT), вартістю на токен і доходом на GPU-акселертор. Спільне рішення F5 і NVIDIA розроблено, щоб безпосередньо вирішувати ці показники.

** Оптимізація токеноміки через інтелектуальну інфраструктуру ШІ**

Перехід від інференсу, орієнтованого на застосунок, до робочих процесів ШІ, керованих агентами, вимагає нових архітектурних підходів для оптимізації пропускної здатності токенів і зниження витрат. BIG-IP Next для Kubernetes тепер використовує статистику NVIDIA NIM, сигнали runtime Dynamo та телеметрію GPU, щоб ухвалювати рішення маршрутизації з урахуванням інференсу до виконання. Підібравши навантаження в режимі реального часу до найбільш відповідних акселераторів, рішення підвищує стабільне використання та зменшує затримку й повторні обчислення.

«Інфраструктура ШІ більше не лише про доступ до GPU або масштабування їхніх розгортань. Вона еволюціонувала до максимізації економічного виходу на акселератор», — сказав Кунал Ананд, Chief Product Officer, F5. «Разом із NVIDIA ми даємо змогу AI-заводам розглядати виробництво токенів як вимірюваний бізнес-показник. BIG-IP Next для Kubernetes надає інтелект і керованість, необхідні, щоб підвищувати GPU-yield, знижувати вартість на токен і масштабувати спільні платформи ШІ з упевненістю».

** Перевірена ефективність інфраструктури: структурне підвищення**

Цифри результативності говорять самі за себе. У тестах, підтверджених The Tolly Group, BIG-IP Next для Kubernetes, прискорений NVIDIA BlueField-3 DPU, забезпечив до 40% зростання пропускної здатності токенів, на 61% швидший час до першого токена (TTFT) і на 34% менше загальної затримки обробки запитів.

Це не просто прирости. Знімаючи з хоста навантаження з мережі, TLS/шифрування, балансування навантаження з урахуванням ШІ та керування трафіком на NVIDIA BlueField-3 DPU, BIG-IP Next для Kubernetes зберігає потужність CPU хоста й звільняє GPU робити те, для чого вони були створені: стабільний інференс із високою пропускною здатністю в масштабі. У результаті підвищується використання GPU, скорочуються черги й збільшується вихід токенів, що дає змогу отримувати нижчу вартість на токен у межах фіксованого обсягу інфраструктури. Критично важливо: не потрібно було змінювати жодні моделі, тож ці покращення можна одразу розгортати в межах наявної інфраструктури AI-заводів. Для підприємств і NeoCloud-провайдерів, які змагаються за токенну економіку, різниця полягає між інфраструктурою, що стримує вихід ШІ, і інфраструктурою, яка його прискорює.

«Прискорена обчислювальна інфраструктура NVIDIA у поєднанні з AI-aware платформою доставки застосунків та безпеки F5 відкриває кращу токеноміку AI-заводів — даючи масштабовану та економічно ефективну інференс без внесення будь-яких змін до моделей», — сказав Кевін Дейрлінг, SVP, Networking, NVIDIA. «Разом F5 і NVIDIA допомагають підприємствам масштабувати інференс AI-заводів ефективно та економічно».

** Створено для AI, керованого агентами, та багатокористувацьких AI-платформ**

Сучасні робочі навантаження ШІ дедалі більше стають такими, що керуються агентами, є персистентними та враховують контекст. Вони потребують інтелектуального керування трафіком, яке традиційне балансування навантаження не може забезпечити. Удосконалене рішення BIG-IP Next для Kubernetes тепер може підтримувати:

Маршрутизацію з урахуванням інференсу для агентних робочих процесів ШІ Інтеграцію з NVIDIA DOCA Platform Framework (DPF), щоб спростити розгортання NVIDIA BlueField DPU та керування їх життєвим циклом EVPN-VXLAN із динамічними VRF для безпечної багатокористувацькості на рівні мережі Інтегровану безпеку, керування токенами та спостережуваність у середовищах Kubernetes для ШІ

Ці можливості дозволяють підприємствам і NeoCloud-провайдерам безпечно спільно використовувати інфраструктуру GPU між бізнес-підрозділами або зовнішніми клієнтами, зберігаючи ізоляцію продуктивності та прогнозовані рівні сервісу.

** Контрольна площина для економіки AI-заводів**

F5 і NVIDIA надають підприємствам перевірені інструменти та найкращі практики, щоб оптимізувати архітектуру інференсу. Завдяки цим досягненням BIG-IP Next для Kubernetes позиціонується як стратегічна контрольна площина для економіки AI-заводів: вона керує споживанням токенів, оптимізує потоки трафіку та максимізує віддачу від інвестицій в інфраструктуру.

Замість того щоб надмірно виділяти ресурси, щоб компенсувати неефективність, організації тепер можуть отримувати більшу економічну цінність з кожного GPU, який уже працює в продакшені. Результат — покращений дохід на GPU, нижчі операційні витрати та масштабовані сервіси ШІ, створені для стабільного зростання. Поєднуючи телеметрію інфраструктури NVIDIA та прискорення на DPU з інтелектом трафіку та можливостями безпеки F5, компанії допомагають підприємствам перетворювати AI-заводи на ефективні, монетизовані платформи, готові до ери агентів.

** Підтримувальні матеріали**

** Блог:** ** AI-заводам потрібна інтелектуальна інфраструктура. Нові результати від The Tolly Group показують, чому. ** Звіт:** ** Незалежне тестування від Tolly: F5 BIG-IP Next для Kubernetes


MENAFN25032026007116015312ID1110904062

Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Популярні активності Gate Fun

    Дізнатися більше
  • Рин. кап.:$2.24KХолдери:1
    0.00%
  • Рин. кап.:$2.24KХолдери:1
    0.00%
  • Рин. кап.:$2.25KХолдери:1
    0.00%
  • Рин. кап.:$2.23KХолдери:1
    0.00%
  • Рин. кап.:$2.22KХолдери:1
    0.00%
  • Закріпити