o1 resmi sürüm + ChatGPT Pro, "Diş Macunu" nda Otman.



OpenAI'nin her hareketi büyük ilgi görüyor.

  昨日其CEO Sam Altman (Sam Altman)高调宣佈要给大家"整个活":OpenAI将开启一个为期12天的马拉松式直播活动,内容会包括新品发布和功能更新等,还有一些 " 圣诞礼物 "。

OpenAI etkinlik duyurusu

Dolayısıyla, tüm dünya teknoloji medyası coşkuyla karıştı, zaman farkı bile 'Teknoloji Yeni Yıl Gala'sını takip etme kararlılığını engelleyemedi.

Pekin saatine göre 6 Aralık'ta saat 02:00'de, '12 Gün OpenAI, Gün 1' canlı yayını başladı. 'Jiazi Light Year' sabaha kadar bu 'büyük hediyeyi' çözerken, sonunda ise Ultraman, 'kalbinin olmadığını' fark etmek gibi soğan soyuyormuş gibi oldu!

Gürültülü bir duyurudan sonra, ilk günün canlı yayını sadece 14 dakika sürdü ve daha çok büyük bir yayından kesilmiş bir dilim gibiydi. OpenAI güncellenmiş modeller ve ürünler yayınladı ve parlak noktaları vardı, ancak samimiyeti biraz eksikti.

Endüstri, bu daha çok gösterişli bir pazarlama stratejisi gibi görünüyor, birisi şaka yaptı: "OpenAI'nin size 12 gün boyunca teknoloji haberlerinin başlıklarını nasıl ele geçireceğini öğretmesi."

Özetlemek gerekirse, OpenAI bu sefer iki şeyi vurguladı:

1. O1 resmi sürümü piyasaya sürüldü, bu, çoklu modalite yeteneklerini ve yeni çıkarım paradigmalarını ilk kez birleştiren bir sürümdür. O1 önizlemesine göre daha akıllı ve tepki hızı belirgin şekilde artmıştır. Şu anda O1 modeli tamamen çevrimiçi olarak kullanılabilir durumda, API işlevi de yakında piyasaya sürülecektir.

Yeni bir profesyonel paket olan ChatGPT Pro yayınlandı, aylık abonelik ücreti 200 dolar olup kullanıcılar sınırsız erişim sağlayabilir ve ses özelliklerini içerir. Ayrıca, Pro paketi ayrıca matematik, bilim ve kodlama gibi zorlu makine öğrenimi referans testlerinde daha iyi performans gösteren o1 Pro modunu da içerir.

1.01 resmi sürüm çoklu modu tanıttı

o1 modelinin resmi sürümü, önceki o1-preview sürümünü değiştirecektir.

Örnek 1 modeli, Amerikan Matematik Davetiyesi Yarışması (AIME 2024) nda %83.3 doğruluk oranına ulaştı ve önizlemesi olan 1-Örnek modelinin %56.7 ve GPT-4 Örnek 1 modelinin %13.4 oranlarını önemli ölçüde geride bıraktı.

Programlama açısından, o1 modeli CodeForces yarışmasında %89,0 puan aldı, o1-preview ise %62,0 aldı, GPT-4o sadece %11,0 aldı, o1 modelinin karmaşık kodlama görevlerini deneyimli bir programcı gibi ele alabildiğini görebiliriz.

GPQA Diamond doktora seviyesindeki bilimsel soru testinde, bu sorular genellikle "cennet seviyesi" zorluğundadır ve o1 hatta insan uzmanların üzerine çıkmaktadır, doğruluk oranı %78.3 iken insan uzmanların skoru %69.7'dir. Ancak o1 preview kadar iyi performans gösteremiyor, bu muhtemelen soru türüne dayalı model performansı veya kullanılan eğitim verilerindeki değişikliklerden kaynaklanıyor olabilir.

  Yeni modelde işleme hızında da iyileştirmeler yapılmıştır. Önceki sürümlerle karşılaştırıldığında, basit sorulara tepki süresi azalmıştır. Ultraman, gösteride yeni o1'in karmaşık sorunları işlerken hata oranının %34 düştüğünü ve sorunun zorluğuna göre işleme süresini ayarlayabileceğini belirtti.

Aynı zamanda, o1, farklı türde girişleri ve çıktıları işleyebilen çok modlu bir özellik getirir. Yapılandırılmış çıktı ve geliştirici mesajı özellikleri eklenmiş ve modelin etkileşim ve kullanılabilirliği artırılmıştır.

Lansmanda, O1 modelinin sorumlusu bir taslak çizerek, güneş enerjisi toplamak için kullanılan bir sistem sergiledi. Uzayda su soğutma sistemi kullanılamadığından, soğutma büyük bir soğutucu blok tarafından sağlanmalıdır. Araştırmacılar daha sonra O1 modeline, bu veri merkezi için 1 gigavat elektrik sağlanması gerektiğinde, GPU dizisini normal çalışma koşullarında tutmak için ne kadar soğutucu blok alanına ihtiyaç duyulacağını sordu.

o1 model, çizimi doğru bir şekilde tanımlar ve anlar, ayrıntılı bir analiz ve hesaplama sonucunda şu sonuca varır: ısı dağılım ihtiyacını karşılamak için 242 milyon metrekarelik devasa bir soğutma paneline ihtiyaç vardır.

  2. Ayda 200 dolarlık ChatGPT Pro

Daha önce söylendiği gibi, bugün 'daha pahalı' versiyon da geldi.

ChatGPT Pro, aylık 200 dolar ücretli bir üst düzey abonelik planıdır ve kullanıcılara en gelişmiş modeller ve araçlara sınırsız erişim imkanı sunar. Özellikle, OpenAI o1 ve o1-mini, GPT-4o ve Advanced Voice'a tam erişim sağlar, özellikle en karmaşık hesaplama gereksinimleri için tasarlanmıştır.

ChatGPT Pro'nun özelliklerinden biri, o1 pro modunu tanıtmasıdır, bu da modelin zorlu sorunları çözerken daha derin düşünme ve analiz yapmasını sağlamak için hesaplama kaynakları yatırımını artırır. Bu hizmet öncelikle gelişmiş veri analizi ve işleme yapması gereken araştırmacılar, mühendisler ve diğer uzmanlar için tasarlanmıştır, iş verimliliğini artırmalarına ve yapay zeka teknolojisinin en sonunda kalmalarına yardımcı olur.

Dış uzmanların değerlendirmesine göre, o1 pro modu, karmaşık veri bilimi, programlama ve vaka analizi sorunlarını çözerken önceki modellere göre daha kesin ve kapsamlı bir yanıt sunabiliyor. Matematik, bilim ve programlama gibi alanlarda makine öğrenimi benchmark testlerinde, o1 pro modu o1 ve o1-preview modellerinden daha iyi performans göstermektedir.

O1 Pro modunun ana avantajlarını vurgulamak için (güvenilirliği artırmak), OpenAI daha katı bir değerlendirme kurulumu kullanır: Modelin sadece dört denemede dört kez doğru cevap verebildiğinde ("4/4 Güvenilirlik"), sorunun çözüldüğü kabul edilir.

Herkes Noel'den önce "çalışmaya yetişmek" gibi görünüyor, Google Deepmind dün en son temel dünya modeli Genie 2'yi duyurdu; Anthropik de Noel'den önce yeni bir model yayınlayabilir.

Yeni bir AI modeli dövüşü turu gibi görünüyor.

  Daha sonra açılacak 11 gün boyunca 'GİZEMLİ KUTU' var, önceden Sora modeli, Dall-e 4 vb. olabileceğini tahmin eden internet kullanıcıları vardı, umarım OpenAI daha fazla ve daha sağlam ürün çıkarabilir.
GPT1.35%
View Original
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
  • Reward
  • Comment
  • Repost
  • Share
Comment
0/400
No comments
  • Pin
Trade Crypto Anywhere Anytime
qrCode
Scan to download Gate App
Community
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)