F5 e NVIDIA Avançam na Economia da Fábrica de IA com Novas Capacidades para Inferência de IA Acelerada

(MENAFN- Asdaf News) ** Dubai – Asdaf News:**

F5 (NASDAQ: FFIV), a líder global na entrega e na proteção de todas as aplicações e APIs, anunciou hoje capacidades alargadas nas suas ** colaborações** em curso

A integração alargada combina ** F5 BIG-IP Next for Kubernetes**

Em sistemas de IA, os tokens representam a unidade mensurável da produção de IA — as palavras, símbolos ou fragmentos de dados gerados e processados durante a inferência. O volume e a velocidade de produção de tokens determinam, em última instância, a experiência do utilizador, a eficiência da infraestrutura e a receita por acelerador.

À medida que as empresas e os fornecedores de GPUaaS correm para monetizar a IA e passar de experiências com IA para serviços geradores de receitas, a eficiência da infraestrutura tornou-se uma métrica determinante. O sucesso é cada vez mais medido não apenas pela capacidade de GPU instalada, mas sim pela economia dos tokens, pelo throughput sustentado de tokens, pelo tempo até ao primeiro token (TTFT), pelo custo por token e pela receita por acelerador de GPU. A solução conjunta da F5 e da NVIDIA foi concebida para responder diretamente a estas métricas.

** Otimizar a tokenómica através de infraestrutura de IA inteligente**

A mudança da inferência centrada em aplicações para fluxos de trabalho de IA orientados por agentes exige novas abordagens arquiteturais para otimizar o throughput de tokens e reduzir custos. O BIG-IP Next for Kubernetes aproveita agora estatísticas do NVIDIA NIM, sinais do runtime Dynamo e telemetria de GPU para tomar decisões de encaminhamento conscientes da inferência antes da execução. Ao corresponder as cargas de trabalho aos aceleradores mais adequados em tempo real, a solução aumenta a utilização sustentada enquanto reduz a latência e a re-computação.

“ A infraestrutura de IA já não serve apenas para aceder a GPUs ou para escalar as suas implementações. Evoluiu para maximizar a produção económica por acelerador”, afirmou Kunal Anand, Chief Product Officer, F5. “Em conjunto com a NVIDIA, estamos a habilitar as fábricas de IA a tratarem a produção de tokens como uma métrica empresarial mensurável. O BIG-IP Next for Kubernetes fornece a inteligência e a governação necessárias para aumentar o rendimento de GPU, reduzir o custo por token e escalar plataformas partilhadas de IA com confiança.”

** Eficiência da infraestrutura validada: um reforço estrutural**

Os números de desempenho falam por si. Em testes validados pela The Tolly Group, o BIG-IP Next for Kubernetes, acelerado por NVIDIA BlueField-3 DPUs, entregou até 40% de aumento no throughput de tokens, 61% mais rápido no tempo até ao primeiro token (TTFT) e 34% de redução na latência global dos pedidos.

Estes não são ganhos incrementais. Ao descarregar a rede, TLS/criptografia, balanceamento de carga consciente de IA e gestão de tráfego para as NVIDIA BlueField-3 DPUs, o BIG-IP Next for Kubernetes preserva a capacidade de CPU do host e liberta as GPUs para fazerem o que foram construídas para fazer: inferência sustentada e de alto throughput à escala. O resultado é melhor utilização de GPU, menos atrasos de enfileiramento e maior rendimento de tokens — permitindo um custo por token mais baixo dentro de um espaço fixo de infraestrutura. De forma crítica, não foram necessárias modificações de modelos, tornando estes ganhos imediatamente implementáveis em toda a infraestrutura de fábricas de IA existente. Para empresas e fornecedores NeoCloud que competem na economia dos tokens, esta é a diferença entre uma infraestrutura que limita a saída de IA e uma infraestrutura que a acelera.

“A infraestrutura de computação acelerada da NVIDIA, combinada com a plataforma de entrega de aplicações e segurança com consciência de IA da F5, desbloqueia economias de fábricas de IA superiores — permitindo inferência escalável e eficiente em termos de custos sem fazer quaisquer alterações aos modelos”, afirmou Kevin Deierling, SVP, Networking, NVIDIA. “Em conjunto, a F5 e a NVIDIA estão a capacitar as empresas a dimensionar a inferência em fábricas de IA de forma eficiente e económica.”

** Concebido para IA orientada por agentes e plataformas de IA multi-tenant**

As cargas de trabalho de IA modernas são cada vez mais orientadas por agentes, persistentes e conscientes de contexto. Exigem controlo inteligente do tráfego que o balanceamento de carga tradicional não consegue fornecer. A solução melhorada BIG-IP Next for Kubernetes pode agora suportar:

Encaminhamento consciente da inferência para fluxos de trabalho de IA agentic Integração com a NVIDIA DOCA Platform Framework (DPF) para simplificar a implementação e a gestão do ciclo de vida das NVIDIA BlueField DPUs EVPN-VXLAN com VRFs dinâmicas para multi-tenancy segura ao nível da rede Segurança integrada, governação de tokens e observabilidade em ambientes de IA Kubernetes

Estas capacidades permitem que empresas e fornecedores NeoCloud partilhem de forma segura a infraestrutura de GPUs entre unidades de negócio ou clientes externos, preservando simultaneamente o isolamento de desempenho e níveis de serviço previsíveis.

** Um plano de controlo para a economia das fábricas de IA**

A F5 e a NVIDIA fornecem às empresas ferramentas validadas e melhores práticas para otimizar a arquitetura de inferência. Com estes avanços, o BIG-IP Next for Kubernetes está posicionado para se tornar um plano de controlo estratégico para a economia das fábricas de IA, governando o consumo de tokens, otimizando os fluxos de tráfego e maximizando o retorno sobre o investimento da infraestrutura.

Em vez de sobreprovisionar para compensar ineficiências, as organizações podem agora extrair maior valor económico de cada GPU já em produção. O resultado é maior receita por GPU, menor overhead operacional e serviços de IA escaláveis construídos para crescimento sustentado. Ao combinar a telemetria de infraestrutura da NVIDIA e aceleração por DPU com as capacidades de inteligência de tráfego e segurança da F5, as empresas estão a ajudar as organizações a transformar fábricas de IA em plataformas eficientes e monetizáveis, prontas para a era agentic.

** Materiais de apoio**

** Blogue:** ** As fábricas de IA precisam de infraestrutura inteligente. Novos resultados do The Tolly Group mostram porquê. ** Relatório:** ** Testes independentes pela Tolly: F5 BIG-IP Next for Kubernetes


MENAFN25032026007116015312ID1110904062

Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixar