F5 y NVIDIA avanzan en la economía de la fábrica de IA con nuevas capacidades para la inferencia de IA acelerada

(MENAFN- Asdaf Noticias) ** Dubái – Asdaf News:**

F5 (NASDAQ: FFIV), el líder global en entregar y asegurar cada aplicación y API, anunció hoy capacidades ampliadas en su colaboración en curso ** **

La integración ampliada combina ** F5 BIG-IP Next para Kubernetes**

En sistemas de IA, los tokens representan la unidad medible de salida de IA: las palabras, símbolos o fragmentos de datos generados y procesados durante la inferencia. El volumen y la velocidad de producción de tokens determinan finalmente la experiencia del usuario, la eficiencia de la infraestructura y los ingresos por acelerador.

A medida que las empresas y los proveedores de GPUaaS compiten por monetizar la IA y pasan de la experimentación con IA a servicios que generan ingresos, la eficiencia de la infraestructura se ha convertido en una métrica definitoria. El éxito se mide cada vez menos simplemente por la capacidad de GPU desplegada, y más por la economía de tokens, el mantenimiento del rendimiento (throughput) de tokens, el tiempo hasta el primer token (TTFT), el costo por token y los ingresos por acelerador de GPU. La solución conjunta de F5 y NVIDIA está diseñada para abordar directamente estas métricas.

** Optimizar la tokenómica mediante una infraestructura de IA inteligente**

El cambio de la inferencia centrada en aplicaciones hacia flujos de trabajo de IA impulsados por agentes exige nuevos enfoques arquitectónicos para optimizar el rendimiento de tokens y reducir costos. BIG-IP Next para Kubernetes ahora aprovecha las estadísticas de NVIDIA NIM, las señales en tiempo de ejecución de Dynamo y la telemetría de GPU para tomar decisiones de enrutamiento conscientes de la inferencia antes de la ejecución. Al ajustar las cargas de trabajo con los aceleradores más adecuados en tiempo real, la solución incrementa la utilización sostenida mientras reduce la latencia y la recompilación.

“La infraestructura de IA ya no se trata solo de acceder a GPU o de escalar sus implementaciones. Ha evolucionado hacia la maximización de la salida económica por acelerador”, dijo Kunal Anand, Chief Product Officer de F5.“Junto con NVIDIA, estamos habilitando que las fábricas de IA traten la producción de tokens como una métrica empresarial medible. BIG-IP Next para Kubernetes proporciona la inteligencia y la gobernanza necesarias para aumentar el rendimiento de GPU, reducir el costo por token y escalar plataformas compartidas de IA con confianza.”

** Eficiencia de infraestructura validada: una mejora estructural**

Los números de rendimiento hablan por sí solos. En las pruebas validadas por The Tolly Group, BIG-IP Next para Kubernetes, acelerado por NVIDIA BlueField-3 DPUs, entregó hasta un aumento del 40% en el throughput de tokens, un 61% más rápido en el tiempo hasta el primer token (TTFT) y una reducción del 34% en la latencia total de las solicitudes.

Estos no son avances incrementales. Al descargar redes, TLS/cifrado, balanceo de carga consciente de la IA y gestión de tráfico en NVIDIA BlueField-3 DPUs, BIG-IP Next para Kubernetes preserva la capacidad de la CPU del host y libera las GPU para hacer lo que fueron construidas para ello: inferencia sostenida y de alto rendimiento a escala. El resultado es una mejor utilización de GPU, menos demoras en colas y un mayor rendimiento de tokens, lo que permite un costo por token más bajo dentro de una huella fija de infraestructura. De manera crítica, no se requirieron modificaciones del modelo, lo que hace que estas mejoras sean implementables de inmediato en toda la infraestructura existente de fábricas de IA. Para las empresas y los proveedores de NeoCloud que compiten en economía de tokens, esta es la diferencia entre una infraestructura que limita la salida de la IA y una infraestructura que la acelera.

“La infraestructura de computación acelerada de NVIDIA, junto con la Plataforma de Entrega de Aplicaciones y Seguridad consciente de la IA de F5, desbloquea la tokenómica superior de fábricas de IA: habilita una inferencia escalable y rentable sin realizar cambios en los modelos”, dijo Kevin Deierling, SVP, Networking, NVIDIA.“Juntos, F5 y NVIDIA están empoderando a las empresas para escalar la inferencia de fábricas de IA de manera eficiente y económica.”

** Diseñado para IA impulsada por agentes y plataformas de IA multi-tenant**

Las cargas de trabajo modernas de IA son cada vez más impulsadas por agentes, persistentes y conscientes del contexto. Exigen un control inteligente del tráfico que el balanceo de carga tradicional no puede proporcionar. La solución mejorada BIG-IP Next para Kubernetes ahora puede admitir:

Enrutamiento consciente de la inferencia para flujos de trabajo de IA agentic Integración con NVIDIA DOCA Platform Framework (DPF) para simplificar el despliegue de NVIDIA BlueField DPU y la gestión de su ciclo de vida EVPN-VXLAN con VRFs dinámicos para multi-tenancy segura a nivel de red Seguridad integrada, gobernanza de tokens y observabilidad dentro de entornos de IA de Kubernetes

Estas capacidades permiten a las empresas y proveedores de NeoCloud compartir de forma segura la infraestructura de GPU entre unidades de negocio o clientes externos, preservando el aislamiento del rendimiento y niveles de servicio predecibles.

** Un plano de control para la economía de la fábrica de IA**

F5 y NVIDIA proporcionan a las empresas herramientas validadas y mejores prácticas para optimizar la arquitectura de inferencia. Con estos avances, BIG-IP Next para Kubernetes está posicionado para convertirse en un plano de control estratégico para la economía de la fábrica de IA, gobernando el consumo de tokens, optimizando los flujos de tráfico y maximizando el retorno de la inversión de la infraestructura.

En lugar de sobredimensionar para compensar ineficiencias, las organizaciones ahora pueden extraer un mayor valor económico de cada GPU que ya está en producción. El resultado es un ingreso mejorado por GPU, menor carga operativa y servicios de IA escalables diseñados para un crecimiento sostenido. Al combinar la telemetría de infraestructura de NVIDIA y la aceleración por DPU con la inteligencia de tráfico y las capacidades de seguridad de F5, las compañías están ayudando a las empresas a transformar fábricas de IA en plataformas eficientes y monetizables listas para la era agentic.

** Materiales de apoyo**

** Blog:** ** Las fábricas de IA necesitan una infraestructura inteligente. Nuevos resultados de The Tolly Group muestran por qué. ** Reporte:** ** Pruebas independientes realizadas por Tolly: F5 BIG-IP Next para Kubernetes


MENAFN25032026007116015312ID1110904062

Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Anclado