F5 dan NVIDIA Tingkatkan Ekonomi Pabrik AI dengan Kemampuan Baru untuk Inferensi AI yang Dipercepat

(MENAFN- Asdaf News) ** Dubai – Asdaf News:**

F5 (NASDAQ: FFIV), pemimpin global dalam menyediakan dan mengamankan setiap aplikasi dan API, hari ini mengumumkan peningkatan kapabilitas dalam kolaborasi yang berkelanjutan ** collaboration**

Integrasi lanjutan tersebut menggabungkan ** F5 BIG-IP Next untuk Kubernetes**

Dalam sistem AI, token mewakili unit terukur dari keluaran AI—kata, simbol, atau fragmen data yang dihasilkan dan diproses selama inferensi. Volume dan kecepatan produksi token pada akhirnya menentukan pengalaman pengguna, efisiensi infrastruktur, dan pendapatan per akselerator.

Saat perusahaan dan penyedia GPUaaS berlomba untuk memonetisasi AI dan beralih dari eksperimen AI ke layanan yang menghasilkan pendapatan, efisiensi infrastruktur telah menjadi metrik penentu. Keberhasilan kini semakin tidak diukur hanya oleh kapasitas GPU yang dikerahkan, tetapi oleh ekonomi token, throughput token yang berkelanjutan, waktu hingga token pertama (TTFT), biaya per token, dan pendapatan per akselerator GPU. Solusi bersama F5 dan NVIDIA dirancang untuk secara langsung mengatasi metrik-metrik ini.

** Mengoptimalkan tokenomics melalui infrastruktur AI yang cerdas**

Peralihan dari inferensi yang berpusat pada aplikasi ke alur kerja AI yang digerakkan oleh agen memerlukan pendekatan arsitektur baru untuk mengoptimalkan throughput token dan menurunkan biaya. BIG-IP Next untuk Kubernetes kini memanfaatkan statistik NVIDIA NIM, sinyal runtime Dynamo, dan telemetri GPU untuk membuat keputusan routing yang peka terhadap inferensi sebelum eksekusi. Dengan mencocokkan beban kerja dengan akselerator yang paling sesuai secara real time, solusi ini meningkatkan pemanfaatan yang berkelanjutan sekaligus mengurangi latensi dan komputasi ulang.

“ Infrastruktur AI kini bukan hanya soal akses ke GPU atau penskalaan penerapan mereka. Infrastruktur AI telah berevolusi menjadi upaya memaksimalkan keluaran ekonomis per akselerator,” kata Kunal Anand, Chief Product Officer, F5.“Bersama NVIDIA, kami memungkinkan pabrik AI memperlakukan produksi token sebagai metrik bisnis yang terukur. BIG-IP Next untuk Kubernetes menyediakan kecerdasan dan tata kelola yang diperlukan untuk meningkatkan hasil GPU, menurunkan biaya per token, dan menskalakan platform AI bersama dengan percaya diri.”

** Efisiensi infrastruktur yang tervalidasi: peningkatan struktural**

Angka kinerja berbicara sendiri. Dalam pengujian yang tervalidasi oleh The Tolly Group, BIG-IP Next untuk Kubernetes yang dipercepat oleh NVIDIA BlueField-3 DPUs menghasilkan peningkatan hingga 40% dalam throughput token, TTFT yang 61% lebih cepat, dan pengurangan 34% dalam latensi permintaan keseluruhan.

Ini bukan peningkatan bertahap. Dengan mendelegasikan jaringan, TLS/enkripsi, load balancing yang peka terhadap AI, dan manajemen lalu lintas ke NVIDIA BlueField-3 DPUs, BIG-IP Next untuk Kubernetes menjaga kapasitas CPU host dan membebaskan GPU untuk melakukan apa yang memang dibangun untuknya: inferensi yang berkelanjutan dan ber-throughput tinggi dalam skala. Hasilnya adalah pemanfaatan GPU yang meningkat, penundaan antrean yang berkurang, dan peningkatan hasil token—memungkinkan biaya per token yang lebih rendah dalam kerangka jejak infrastruktur yang tetap. Yang terpenting, tidak diperlukan modifikasi model, sehingga peningkatan ini dapat langsung diterapkan di seluruh infrastruktur pabrik AI yang sudah ada. Bagi perusahaan dan penyedia NeoCloud yang bersaing pada ekonomi token, perbedaan ini adalah antara infrastruktur yang membatasi keluaran AI dan infrastruktur yang mempercepatnya.

“ Infrastruktur komputasi akselerasi NVIDIA yang dipadukan dengan Application Delivery and Security Platform yang peka terhadap AI dari F5 membuka tokenomics pabrik AI yang lebih unggul—memberikan inferensi yang dapat diskalakan dan hemat biaya tanpa membuat perubahan apa pun pada model,” kata Kevin Deierling, SVP, Networking, NVIDIA.“Bersama-sama, F5 dan NVIDIA memberdayakan perusahaan untuk menskalakan inferensi pabrik AI secara efisien dan ekonomis.”

** Dibangun untuk AI yang digerakkan oleh agen dan platform AI multi-tenant**

Beban kerja AI modern semakin digerakkan oleh agen, persisten, dan peka konteks. Mereka membutuhkan kontrol lalu lintas cerdas yang tidak dapat diberikan oleh load balancing tradisional. Solusi BIG-IP Next untuk Kubernetes yang ditingkatkan kini dapat mendukung:

Perutean yang peka terhadap inferensi untuk alur kerja AI yang digerakkan agen Integrasi dengan NVIDIA DOCA Platform Framework (DPF) untuk menyederhanakan penerapan dan manajemen siklus hidup NVIDIA BlueField DPU EVPN-VXLAN dengan VRF dinamis untuk multi-tenancy jaringan yang aman di tingkat jaringan Keamanan terintegrasi, tata kelola token, dan observabilitas di lingkungan AI Kubernetes

Kemampuan ini memungkinkan perusahaan dan penyedia NeoCloud untuk secara aman berbagi infrastruktur GPU di antara unit bisnis atau pelanggan eksternal sambil tetap menjaga isolasi performa dan tingkat layanan yang dapat diprediksi.

** Sebuah control plane untuk ekonomi pabrik AI**

F5 dan NVIDIA menyediakan alat dan praktik terbaik yang tervalidasi bagi perusahaan untuk mengoptimalkan arsitektur inferensi. Dengan kemajuan ini, BIG-IP Next untuk Kubernetes diposisikan untuk menjadi control plane strategis bagi ekonomi pabrik AI—mengatur konsumsi token, mengoptimalkan alur lalu lintas, dan memaksimalkan pengembalian investasi infrastruktur.

Alih-alih melakukan overprovisioning untuk mengimbangi ketidakefisienan, organisasi kini dapat mengekstrak nilai ekonomis yang lebih besar dari setiap GPU yang sudah ada dalam produksi. Hasilnya adalah pendapatan per GPU yang meningkat, overhead operasional yang lebih rendah, dan layanan AI yang dapat diskalakan yang dibangun untuk pertumbuhan berkelanjutan. Dengan menggabungkan telemetri infrastruktur NVIDIA dan akselerasi DPU dengan kecerdasan lalu lintas dan kapabilitas keamanan F5, perusahaan membantu pelanggan mengubah pabrik AI menjadi platform yang efisien dan siap dimonetisasi, untuk era yang digerakkan oleh agen.

** Materi pendukung**

** Blog:** ** AI factories need intelligent infrastructure. New results from The Tolly Group show why. ** Report:** ** Independent testing by Tolly: F5 BIG-IP Next for Kubernetes


MENAFN25032026007116015312ID1110904062

Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Sematkan