Model AI Terbaru Alibaba QwQ-32B-Preview Melampaui O1 dari OpenAI dalam Beberapa Benchmark

Seiring dengan intensitas persaingan di bidang AI, raksasa ritel Tiongkok Alibaba memperkenalkan QwQ-32B-Preview-nya yang dilaporkan lebih unggul dari seri o1 OpenAI.

Model terbaru dilaporkan mengungguli model o1-preview dan o1-mini dari OpenAI dalam beberapa benchmark tertentu, seperti tes AIME dan MATH, yang mengevaluasi performa model AI dalam teka-teki logika dan masalah matematika.

Alibaba telah membuat QwQ-32B-Preview untuk diunduh.

Menurut raksasa ritel, model baru Alibaba mampu mengatasi masalah yang kompleks dan rumit dibandingkan dengan model bahasa besar (LLM) biasa seperti ChatGPT-4 dan Claude 3.5.

Sebuah artikel oleh Benzinga menunjukkan bahwa QwQ-32B-Preview adalah salah satu dari sedikit yang tersedia di bawah lisensi yang memungkinkan pengguna untuk mengunduh dan menggunakannya. Model ini kini tersedia di platform pengembangan AI Hugging Face.

Namun, Alibaba merilis komponen tertentu dari model tersebut untuk membatasi replikasi penuh dari model atau wawasan tentang cara kerjanya.

Model terbaru Alibaba memiliki 32,5 miliar parameter yang memungkinkannya mengatasi masalah hingga 32.000 kata. Dengan kemampuan signifikan dan aksesibilitas yang semi-terbuka, produk baru Alibaba ini membuka jalan bagi terobosan yang transformatif dalam teknologi penalaran AI.

Pengumuman transparan dari Alibaba, yang menekankan pada kecanggihan modelnya, OpenAI telah menjaga hitungan parameter mereka tetap rahasia.

Kedatangan model ini datang pada saat OpenAI sedang membuat kemajuan signifikan dalam sektor AI. Pada bulan Oktober, valuasi OpenAI melonjak menjadi $157 miliar setelah putaran pendanaan yang sukses.

Minggu lalu, SoftBank Group SFTBF dilaporkan meningkatkan kepemilikan sahamnya dalam pembuat ChatGPT melalui pembelian saham karyawan senilai $1,5 miliar.

OpenAI juga dikatakan sedang menjelajahi pengembangan web browser sendiri untuk menantang browser Google Chrome milik Alphabet setelah tekanan dari Departemen Kehakiman AS untuk melepaskannya.

Alibaba mengakui bahwa model ini juga memiliki kekurangan

Meskipun memiliki beberapa keunggulan yang unik, model baru ini juga memiliki keterbatasan. Menurut kelompok tersebut, QwQ-32B-Preview memiliki isu seperti perpindahan bahasa yang tak terduga, yang berpotensi membingungkan pengguna. Model juga kurang baik dalam tugas-tugas yang memerlukan penalaran akal sehat, hal ini umum terjadi pada banyak kecerdasan buatan.

Menurut AutoGPT, model ini mungkin terjebak dalam perulangan logis, yang mengakibatkan penundaan dalam memberikan respons.

Meskipun memiliki kekurangan, kemampuan penalarannya memungkinkannya untuk memeriksa fakta sendiri, sehingga mengurangi kesalahan tetapi meningkatkan waktu resolusi.

Dengan merenungkan tugas dan merencanakan langkah-langkah, model Alibaba menghindari beberapa kesalahan yang mempengaruhi AI tradisional. Namun, pendekatan ini membutuhkan waktu ekstra yang mungkin membatasi aplikasi real-time.

Menurut Benzinga, respons 'QwQ-32B-Preview' sejalan dengan standar regulasi China, menghindari topik yang sensitif secara politik.

Sebagai contoh, topik yang sensitif secara politik seperti Taiwan akan memberikan respons yang sejalan dengan sikap pemerintah China.

Selain itu, berita tentang peristiwa seperti Tiananmen Square tidak menghasilkan respons apa pun, menunjukkan desain hati-hati model ini.

Meskipun ini mungkin ideal untuk pasar Tiongkok, hal ini juga dapat membatasi daya tariknya di pasar global. Namun, model ini merupakan langkah penting ke dalam dunia AI penalaran. Meskipun keterbatasannya mungkin membatasi daya tarik globalnya, komponen lain seperti logika dan sifat semi-terbuka membuatnya menjadi pesaing yang besar bagi OpenAI.

Menurut AutoGPT, QwQ-32B-Preview menyoroti potensi, dan tantangan, dari ujung yang menarik ini di mana laboratorium AI di seluruh dunia sedang bekerja untuk menyempurnakan teknologi penalaran.

Dari Nol ke Web3 Pro: Rencana Peluncuran Karier 90 Hari Anda

MATH-3.48%
Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • 1
  • Bagikan
Komentar
0/400
GateUser-a578b9cfvip
· 2024-11-29 23:43
Buy the Dip 🤑
Balas0
  • Sematkan
Perdagangkan Kripto Di Mana Saja Kapan Saja
qrCode
Pindai untuk mengunduh aplikasi Gate
Komunitas
Bahasa Indonesia
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)