Krisis daya komputasi: Google diam-diam menerapkan batas penggunaan Gemini untuk Meta

robot
Pembuatan abstrak sedang berlangsung

人工智能基础设施的供需矛盾正在全球顶级科技公司之间激化。据知情人士透露,谷歌约于今年3月告知Meta,无法满足其全部Gemini算力需求,并对这家社交媒体巨头实施了使用上限——即便是全球最大的AI服务商,也难以应对汹涌而来的算力需求。

据英国《金融时报》报道,上述限制至今仍未解除,已导致Meta多个内部AI项目遭到干扰和延误。受此影响,Meta已要求员工提高AI算力使用效率,在内部推行对AI token的精打细算。谷歌与Meta均拒绝就此置评。

这一局面迫使谷歌加快扩容步伐。谷歌本月早些时候与埃隆·马斯克旗下SpaceX签订了一份每月9.2亿美元的算力租赁协议。谷歌CEO桑达尔·皮查伊在今年一季度财报会议上坦言:"近期我们在算力方面确实面临制约,如果能够满足需求,云业务收入将会更高。"

Meta并非孤例。多位知情人士指出,其他谷歌企业客户同样受到程度不一的限制,而Meta因需求规模异常庞大受影响最深。这场风波折射出AI推理工作负载的爆炸式增长,已成为整个行业面临的最大挑战之一。

算力瓶颈持续承压,大客户首当其冲

尽管各大科技公司已在芯片、数据中心和电力供应上砸下数百亿美元,AI算力供给仍难以追上需求增速。

谷歌一季度云业务收入首次突破200亿美元,已签署但尚未交付的云合同积压量环比几乎翻番,超过4600亿美元。皮查伊明确表示,算力制约在近期内仍将持续。

在此背景下,Meta受到的冲击尤为突出。知情人士表示,正是Meta等大型企业客户的高强度需求,直接推动谷歌加速寻求外部算力来源。随着企业大规模部署聊天机器人、编程助手和AI智能体,推理工作负载——即模型训练完成后在实际应用中执行任务所消耗的算力——正成为行业的核心瓶颈。

Meta内部项目受阻,加速转向自研模型

Meta在内部广泛使用Gemini,涵盖平台安全审核(包括识别诈骗内容、清除有害信息)、客服及广告辅助聊天机器人,以及部分内部工作流和代码开发,同时搭配使用Anthropic的Claude等其他模型。

据知情人士透露,Meta最初选择Gemini,是因为其表现优于公司自研的Llama开源模型。然而随着算力限制的收紧,Meta正加快向自研模型迁移。多位知情人士表示,Meta近期已开始优先推广其新推出的Muse Spark模型,该模型被认为在性能上已能与Gemini相抗衡,有助于降低对外部模型的依赖。

Meta CEO马克·扎克伯格此前持续加大对AI人才和基础设施的投入,致力于打造其所称的"个人超级智能"。与谷歌不同,Meta没有云业务,正在加速自建数据中心体系,并承诺到2028年在美国累计投资6000亿美元。

谷歌借道SpaceX扩容,行业寻求破局

面对算力压力,谷歌本月与SpaceX签署每月9.2亿美元的算力租赁协议,以弥补基础设施缺口。AI实验室Anthropic上月也与SpaceX达成了类似协议。

谷歌对Meta采取限制措施一事,为外界提供了一个罕见窗口,得以窥见全球顶级AI服务商在算力分配上所面临的真实压力。当前,整个AI行业的基础设施瓶颈正从训练侧蔓延至推理侧,供需矛盾的化解仍有赖于新一轮大规模资本投入的落地兑现。

风险提示及免责条款

        市场有风险,投资需谨慎。本文不构成个人投资建议,也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。Kontradiksi antara pasokan dan permintaan infrastruktur kecerdasan buatan semakin memuncak di antara perusahaan teknologi global terkemuka. Menurut sumber yang mengetahui masalah ini, Google memberi tahu Meta sekitar bulan Maret tahun ini bahwa mereka tidak dapat memenuhi seluruh permintaan daya komputasi Gemini, dan menerapkan batas penggunaan pada raksasa media sosial tersebut—bahkan penyedia layanan AI terbesar di dunia pun kesulitan menghadapi permintaan daya komputasi yang melonjak.

Menurut laporan Financial Times Inggris, pembatasan tersebut masih belum dicabut hingga saat ini, yang telah menyebabkan beberapa proyek AI internal Meta mengalami gangguan dan penundaan. Akibatnya, Meta telah meminta karyawannya untuk meningkatkan efisiensi penggunaan daya komputasi AI dan menerapkan penghematan token AI secara internal. Google dan Meta sama-sama menolak berkomentar.

Situasi ini memaksa Google untuk mempercepat langkah ekspansinya. Awal bulan ini, Google menandatangani perjanjian sewa daya komputasi senilai $920 juta per bulan dengan SpaceX milik Elon Musk. CEO Google Sundar Pichai mengakui dalam konferensi laba kuartal pertama tahun ini: "Kami memang menghadapi keterbatasan daya komputasi dalam waktu dekat. Jika permintaan dapat dipenuhi, pendapatan bisnis cloud akan lebih tinggi."

Meta bukan satu-satunya. Beberapa sumber menunjukkan bahwa pelanggan perusahaan Google lainnya juga mengalami pembatasan dengan tingkat yang berbeda, dan Meta adalah yang paling terpengaruh karena skala permintaannya yang sangat besar. Insiden ini mencerminkan ledakan beban kerja inferensi AI, yang telah menjadi salah satu tantangan terbesar yang dihadapi seluruh industri.

Keterbatasan daya komputasi terus menekan, pelanggan besar terkena dampak paling awal

Meskipun perusahaan teknologi besar telah menginvestasikan puluhan miliar dolar dalam chip, pusat data, dan pasokan listrik, pasokan daya komputasi AI masih sulit mengejar laju pertumbuhan permintaan.

Pendapatan bisnis cloud Google pada kuartal pertama melampaui $20 miliar untuk pertama kalinya, dengan backlog kontrak cloud yang telah ditandatangani tetapi belum diserahkan hampir dua kali lipat secara kuartal, melebihi $460 miliar. Pichai dengan jelas menyatakan bahwa keterbatasan daya komputasi akan terus berlanjut dalam waktu dekat.

Dalam konteks ini, Meta mengalami dampak yang paling menonjol. Sumber mengatakan bahwa permintaan intensif dari pelanggan perusahaan besar seperti Meta secara langsung mendorong Google untuk mempercepat pencarian sumber daya komputasi eksternal. Dengan perusahaan yang menerapkan chatbot, asisten pemrograman, dan agen AI dalam skala besar, beban kerja inferensi—yaitu daya komputasi yang dikonsumsi saat menjalankan tugas dalam aplikasi nyata setelah pelatihan model—menjadi hambatan utama industri.

Proyek internal Meta terhambat, mempercepat peralihan ke model buatan sendiri

Meta menggunakan Gemini secara luas secara internal, mencakup audit keamanan platform (termasuk mengidentifikasi konten penipuan, menghapus informasi berbahaya), chatbot layanan pelanggan dan bantuan iklan, serta beberapa alur kerja internal dan pengembangan kode, sambil juga menggunakan model lain seperti Claude dari Anthropic.

Menurut sumber yang mengetahui, Meta awalnya memilih Gemini karena kinerjanya lebih unggul dari model open-source Llama buatan perusahaan sendiri. Namun, dengan meningkatnya pembatasan daya komputasi, Meta mempercepat transisi ke model buatan sendiri. Beberapa sumber mengatakan bahwa Meta baru-baru ini mulai memprioritaskan promosi model Muse Spark yang baru dirilis, yang dianggap mampu bersaing dengan Gemini dalam hal kinerja, membantu mengurangi ketergantungan pada model eksternal.

CEO Meta Mark Zuckerberg sebelumnya terus meningkatkan investasi dalam bakat AI dan infrastruktur, berkomitmen untuk menciptakan apa yang disebutnya "superintelijen pribadi". Tidak seperti Google, Meta tidak memiliki bisnis cloud dan sedang mempercepat pembangunan sistem pusat data sendiri, berjanji untuk berinvestasi kumulatif $600 miliar di Amerika Serikat hingga tahun 2028.

Google berekspansi melalui SpaceX, industri mencari jalan keluar

Menghadapi tekanan daya komputasi, Google menandatangani perjanjian sewa daya komputasi senilai $920 juta per bulan dengan SpaceX bulan ini untuk mengatasi kesenjangan infrastruktur. Laboratorium AI Anthropic juga mencapai kesepakatan serupa dengan SpaceX bulan lalu.

Tindakan Google dalam menerapkan pembatasan pada Meta memberikan jendela langka bagi dunia luar untuk melihat tekanan nyata yang dihadapi penyedia layanan AI global terkemuka dalam alokasi daya komputasi. Saat ini, hambatan infrastruktur di seluruh industri AI menyebar dari sisi pelatihan ke sisi inferensi, dan penyelesaian kontradiksi pasokan-permintaan masih bergantung pada realisasi investasi modal besar-besaran putaran baru.

Peringatan risiko dan ketentuan tanggung jawab

        Pasar memiliki risiko, investasi harus hati-hati. Artikel ini bukan merupakan saran investasi pribadi, dan tidak mempertimbangkan tujuan investasi, situasi keuangan, atau kebutuhan khusus pengguna individu. Pengguna harus mempertimbangkan apakah pendapat, pandangan, atau kesimpulan dalam artikel ini sesuai dengan situasi spesifik mereka. Investasi berdasarkan ini adalah tanggung jawab sendiri.
Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar