Meta bangun? Kepala AI: Model baru "Semangka" skornya bisa menyamai GPT-5.5

Kepala Lab Superintelijen Meta, Alexandr Wang, mengungkapkan dalam rapat internal bahwa model baru yang sedang dilatih, "Semangka," dengan daya komputasi sekitar 10 kali lipat dari Muse Spark, telah menyamai skor GPT-5.5 milik OpenAI. (Pratinjau: Selamat tinggal Llama! Meta meluncurkan model AI multimodal baru "Muse Spark", sepenuhnya masuk ke IG, FB, dan kacamata pintar) (Latar belakang: Model baru OpenAI GPT-5.6 tidak dirilis: Pemerintah Trump meminta rilis bertahap) Daftar Isi Beralih

  • Dari open source yang kalah hingga lari ke closed source
  • Sepuluh kali daya komputasi, berapa banyak kesenjangan yang didapat?
  • Garis akhir yang dikejar sebenarnya terus bergerak Menurut laporan Business Insider yang mengutip dua sumber, Kepala Lab Superintelijen Meta, Alexandr Wang, minggu ini dalam rapat all-hands internal memberi tahu karyawan bahwa model generasi berikutnya dengan nama kode "Semangka" telah menyamai skor model andalan GPT-5.5 yang dirilis OpenAI pada April tahun ini. Semangka, seperti Avocado yang dirilis pada April, adalah kode buah yang biasa digunakan Meta secara internal. Wang mengatakan bahwa Semangka adalah model berikutnya setelah Muse Spark (kode internal Avocado) yang diluncurkan pada April tahun ini, dan masih dalam pelatihan. Sumber daya komputasi yang digunakan adalah satu orde magnitudo lebih besar dari Muse Spark, jika dikonversi mendekati 10 kali lipat. Ini adalah pertama kalinya dalam setahun terakhir Meta secara terbuka membandingkan model internal yang belum dirilis dengan model andalan aktif OpenAI. Dia tidak mengungkapkan benchmark mana yang digunakan untuk menentukan "menyamai"... Meta menolak berkomentar, dan OpenAI juga belum menanggapi permintaan komentar.

Dari open source yang kalah hingga lari ke closed source

Kecemasan AI Meta bukanlah hal baru. Perusahaan ini menghabiskan banyak uang untuk menumpuk daya komputasi, membangun pusat data, dan merekrut talenta. Selama dua tahun terakhir, mereka ingin merebut tempat di antara OpenAI, Google, dan Anthropic, tetapi seri Llama selalu berada di posisi "skor tidak buruk, tetapi masih jauh dari puncak." Tahun lalu, Meta membeli 49% saham tanpa hak suara ScaleAI seharga 14,3 miliar dolar AS. Transaksi ini selain memberi Meta kemampuan pelabelan data ScaleAI, juga membuat salah satu pendiri Alexandr Wang langsung turun sebagai Chief AI Officer pertama perusahaan. Setelah Wang menjabat, departemen AI yang ada diubah namanya menjadi Meta Superintelligence Labs. Selain mengawasi penelitian dan pengembangan, ia juga memimpin tim riset elit dengan kode TBD, serta proyek perangkat keras yang baru-baru ini didorong. Perlombaan senjata talenta ini juga membuat tingkat kompensasi yang ditawarkan Meta terus mendongkrak standar di seluruh lingkaran AI Silicon Valley. Model pertama yang dikeluarkan Wang setelah menjabat adalah Muse Spark yang dirilis pada April tahun ini. Ada perbedaan mendasar antara model ini dengan Llama sebelumnya: Llama adalah open weight, sedangkan Muse Spark sepenuhnya closed source. Meta hanya mengatakan "berharap versi masa depan dapat open source." Angka skornya tidak buruk, tetapi sama-sama tidak mampu melampaui OpenAI atau Anthropic. Setelah dirilis, model ini dengan cepat dimasukkan ke dalam produk utama seperti Instagram, Facebook, dan kacamata pintar, sehingga hasil tim Wang pertama kali langsung menyentuh pengguna biasa, tidak hanya tinggal di papan peringkat benchmark.

Sepuluh kali daya komputasi, berapa banyak kesenjangan yang didapat?

Angka yang diberikan Wang dalam rapat internal sangat gamblang: daya komputasi pelatihan yang digunakan Semangka satu orde magnitudo lebih besar dari Muse Spark. Secara sederhana, Meta kali ini bukan fine-tuning, tetapi langsung melipatgandakan taruhan sepuluh kali lipat. Ini juga selaras dengan logika Wang yang konsisten: daya komputasi menentukan batas atas model, skor hanya tahap pertama verifikasi, yang benar-benar menentukan kemenangan adalah apakah model bisa dimasukkan ke dalam lini produk nantinya. Dia juga memberikan sinyal serupa di X:

Pertama, Mark jelas berbicara tentang kemajuan industri secara keseluruhan dalam kemampuan agen.

Tapi, selagi kita membahas topik ini: Pembaruan Muse Spark berikutnya akan segera hadir. Peningkatan besar dalam kemampuan coding dan agen untuk lebih kompetitif dengan model-model terkemuka lainnya.… https://t.co/uTjx8sZM2A — Alexandr Wang (@alexandr_wang) 3 Juli 2026 Postingan tersebut mengumumkan bahwa Muse Spark akan segera mendapatkan pembaruan, dengan fokus pada kemampuan kode dan tugas agen, tujuannya untuk memperkecil jarak dengan pesaing. Ada pengguna yang bertanya kapan Meta dapat meluncurkan model kode setara dengan Claude Opus. Wang menjawab "segera," dan mengatakan bahwa orang-orang akan menyukai apa yang sedang mereka "masak." Klaim yang sedikit misterius ini, apakah pasar akan membelinya masih belum diketahui.

Garis akhir yang dikejar sebenarnya terus bergerak

Namun yang agak canggung adalah, GPT-5.5 adalah model andalan OpenAI pada April tahun ini, tetapi OpenAI pada akhir Juni telah merilis keluarga GPT-5.6 yang lebih kuat. Hanya saja, atas permintaan pemerintah Trump, saat ini hanya dibuka untuk pratinjau bagi mitra terdaftar dalam jumlah terbatas, belum dirilis secara penuh. Bagi OpenAI, ini bukan hambatan teknis, melainkan hambatan kebijakan. Model sudah lama jadi, hanya saja belum diizinkan untuk dibuka sepenuhnya. Artinya, Semangka sebenarnya mengejar model lama OpenAI dua bulan lalu, batas atas sebenarnya sudah bergerak ke atas. Jika pernyataan Wang benar, ini masih merupakan sinyal pertama yang bisa ditunjukkan Meta setelah dua tahun mengeluarkan uang dan merekrut. Meta sebelumnya telah memberi tahu investor bahwa pengeluaran tahun ini untuk infrastruktur seperti chip dan pusat data akan dinaikkan dari perkiraan sebelumnya 115-135 miliar dolar AS menjadi 125-145 miliar dolar AS; bonus penandatanganan untuk peneliti top bahkan disebut mencapai ratusan juta dolar per orang. Ini berarti perang kilat talenta yang dipertaruhkan Zuckerberg mungkin akhirnya melihat sedikit hasil. Tapi skor adalah target yang paling mudah dicapai; apakah Semangka benar-benar bisa disajikan dan membuat pengembang membelinya, itulah ambang batas yang belum bisa dilewati Meta selama dua tahun terakhir.

Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Disematkan