CoinWorld melaporkan, Nvidia mengumumkan rincian biaya seri Blackwell: biaya GPU dua kali lipat dari generasi sebelumnya, tetapi biaya per token turun sekitar 35 kali lipat. Penilaian infrastruktur inferensi harus fokus pada biaya per token daripada biaya per GPU per jam. Dengan model inferensi deepseek-r1 MOE membandingkan Blackwell (GB300 NVL72) dan Hopper (HGX H200): harga sewa cloud Blackwell 2,65 dolar AS/jam, Hopper 1,41 dolar AS/jam, hampir dua kali lipat; tetapi token per detik per GPU meningkat dari 90 menjadi 6000, peningkatan sekitar 65 kali lipat. Setelah amortisasi, biaya per juta token turun dari 4,20 dolar AS menjadi 0,12 dolar AS, dengan syarat mengaktifkan optimisasi perangkat lunak seperti FP4 dan lainnya.

CoinNetwork

2026-04-30 04:14:15

Pembuatan abstrak sedang berlangsung

Berita dari CoinWorld, Nvidia merilis rincian biaya untuk seri Blackwell mereka, menunjukkan bahwa biaya GPU lebih mahal dua kali lipat dibandingkan generasi sebelumnya, tetapi biaya per token justru 35 kali lebih murah. Menurut blog Nvidia, saat mengevaluasi infrastruktur inferensi, harus fokus pada “biaya per token” bukan “biaya per GPU per jam”. Menggunakan deepseek-r1 (model inferensi MOE) sebagai objek pengujian, dibandingkan Blackwell (GB300 NVL72) dengan generasi sebelumnya Hopper (HGX H200). Berdasarkan harga sewa pasar cloud, Blackwell per GPU per jam adalah 2,65 dolar AS, hampir dua kali lipat dari Hopper yang 1,41 dolar AS, tetapi output token per GPU per detik meningkat dari 90 menjadi 6000, peningkatan 65 kali, sehingga biaya per juta token setelah dibagi turun dari 4,20 dolar AS menjadi 0,12 dolar AS. Perlu dicatat bahwa biaya 0,12 dolar AS ini didasarkan pada asumsi pengaktifan berbagai optimisasi perangkat lunak seperti inferensi presisi rendah FP4 dan prediksi multi-token.

Lihat Asli

Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.

Hadiah
suka
Komentar
Posting ulang
Bagikan

Komentar

Tambahkan komentar

Tidak ada komentar

Topik Trending
Lihat Lebih Banyak
#
WCTCTradingKingPK
388.55K Popularitas
#
#FedHoldsRateButDividesDeepen
14.03K Popularitas
#
IsraelStrikesIranBTCPlunges
36.43K Popularitas
#
#DailyPolymarketHotspot
716.16K Popularitas
#
BitcoinSpotVolumeNewLow
162.66M Popularitas

Sematkan

peta situs

Nvidia merilis rincian biaya Blackwell: GPU dua kali lebih mahal, setiap token 35 kali lebih murah

Topik Trending

WCTCTradingKingPK

#FedHoldsRateButDividesDeepen

IsraelStrikesIranBTCPlunges

#DailyPolymarketHotspot

BitcoinSpotVolumeNewLow

Sematkan