Alibaba’nın En Yeni Yapay Zeka Modeli QwQ-32B-Önizleme, Bazı Karşılaştırmalarda OpenAI’in O1’ini Geride Bırakıyor

Yapay zeka alanında rekabet arttıkça, Çinli perakende devi Alibaba'nın OpenAI'nin o1 serisini geride bıraktığı bildirilen QwQ-32B-Preview'ini tanıttığı duyuruldu.

Son model, AIME ve MATH testleri gibi belirli bazı ölçütlerde OpenAI'nin o1-preview ve o1-mini modellerini geride bıraktığı bildiriliyor. Bu testler yapay zeka modellerinin mantık bulmacaları ve matematik problemlerinde performansını değerlendirir.

Alibaba, indirme için QwQ-32B-Önizleme'yi yapmıştır.

Perakende devrine göre, Alibaba'nın yeni modeli, ChatGPT-4 ve Claude 3.5 gibi normal büyük dil modellerine (LLM'ler) kıyasla karmaşık ve ince problemleri ele alma yeteneğine sahip.

Bir Benzinga makalesine göre, QwQ-32B-Önizleme, kullanıcıların indirebileceği ve kullanabileceği izin verici bir lisans altında sunulan az sayıdaki modellerden biridir. Model şimdi Yapay Zeka geliştirme platformu Hugging Face üzerinde mevcuttur.

Ancak, Alibaba modelinin tamamen kopyalanmasını veya çalışma şekline dair içgörülerin sınırlanması için modelin belirli bileşenlerini yayınladı.

Alibaba'nın en son modeli 32,5 milyar parametreye sahip olup, 32.000 kelimeye kadar işleme imkanı tanır. Modelin önemli yetenekleri ve yarı açık erişilebilirliği ile Alibaba'ın yeni girişimi, yapay zeka mantık teknolojisinde dönüşümsel bir sıçramanın önünü açıyor.

Alibaba'nın modelin sofistike yapısını vurgulayan şeffaf açıklamasıyla birlikte, OpenAI parametre sayılarını gizli tutmuştur.

Bu modelin gelişi, OpenAI'nin yapay zeka sektöründe önemli adımlar attığı bir döneme denk geliyor. Ekim ayında, OpenAI'nin değeri başarılı bir fonlama turuyla 157 milyar doları aştı.

Bu haftanın başlarında, SoftBank Group SFTBF, bildirildiğine göre, 1.5 milyar dolarlık bir çalışan payı satın alımı yoluyla ChatGPT üreticisindeki payını artırdı.

ABD Adalet Bakanlığı'nın baskısı sonrasında, OpenAI'in ayrıştırılması için baskı yapıldıktan sonra, Alphabet'in yan kuruluşu olan Google Chrome tarayıcısına meydan okumak için kendi web tarayıcısının geliştirilmesi de araştırılıyor deniyor.

Alibaba, modelin de kusurları olduğunu kabul ediyor

Yeni model bazı benzersiz güçlere sahip olsa da, aynı zamanda bazı sınırlamalara da sahiptir. Gruba göre, QwQ-32B-Önizleme beklenmedik dil değişiklikleri gibi sorunlara sahiptir, bu da kullanıcıları potansiyel olarak kafa karıştırabilir. Model ayrıca genel mantık akıl yürütme gerektiren görevlerde performansının altında kalır, bu da birçok yapay zeka ile ortaktır.

AutoGPT'ye göre, model mantıksal döngülere sıkışabilir ve cevapları geciktirebilir.

Kusurları olmasına rağmen, mantık yetenekleri ona kendini gerçekleri kontrol etmesine izin verir, bu nedenle hataları azaltır ancak çözünürlük süresini artırır.

Alibaba'nın modeli, görevleri akılcı bir şekilde düşünerek ve adımları planlayarak, geleneksel yapay zekayı etkileyen bazı sorunlardan kaçınır. Ancak bu yaklaşım, gerçek zamanlı uygulamaları sınırlayabilecek ekstra zaman gerektirir.

Benzinga'ya göre, QwQ-32B-Önizleme yanıtları, Çin düzenleyici standartlarıyla uyumlu olup, siyasi olarak hassas konulardan kaçınmaktadır.

Örneğin, Tayvan gibi siyasi olarak hassas konular Çin hükümetinin tutumuyla uyumlu yanıtlar verecektir.

Ayrıca, Tiananmen Meydanı gibi olaylar hakkında sonuç gelmiyor, modelin dikkatli tasarımını gösteriyor.

Bu, Çin pazarı için ideal olabilir, ancak aynı zamanda küresel pazardaki çekiciliğini de sınırlayabilir. Bununla birlikte, model, mantık yapay zeka dünyasına önemli bir adımdır. Sınırlamaları küresel çekiciliğini daraltabilirken, mantık ve yarı açık doğası gibi diğer bileşenleri, OpenAI için büyük bir rakip haline getirir.

AutoGPT'ye göre, QwQ-32B-Önizleme, dünya çapında AI laboratuvarlarının akıl yürütme teknolojisini geliştirmeye çalıştığı bu heyecan verici sınıra ilişkin potansiyeli ve zorlukları vurgulamaktadır.

Sıfırdan Web3 Pro'ya: 90 Günlük Kariyer Başlatma Planınız

MATH3.32%
View Original
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
  • Reward
  • 1
  • Repost
  • Share
Comment
0/400
GateUser-a578b9cfvip
· 2024-11-29 23:43
dipten satın al 🤑
View OriginalReply0
  • Pin
Trade Crypto Anywhere Anytime
qrCode
Scan to download Gate app
Community
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)