o1正式版+ChatGPT Pro、ウルトラマンは「歯磨き粉を絞る」。



OpenAIのすべての動きが注目されています。

昨日、CEOのサム・アルトマン(Sam Altman)は大々的に発表し、OpenAIは12日間のマラソンライブイベントを開始することを発表しました。内容には新製品の発表や機能の更新などが含まれ、さらにいくつかの「クリスマスプレゼント」があります。

OpenAIのイベント予告

そして、世界中のテクノロジーメディアが沸き立ちました。時差でも「テクノロジーの春晩」を追いかける決意は止められませんでした。

北京時間12月6日午前2時、「12 Days of OpenAI, Day 1」のライブ配信が始まりました。そして、「甲子光年」は徹夜でこの「大贈り物」を解説しましたが、最後にはウルトラマン、君は「心がない」だとわかりました!

大々的予告の後、初日のライブ配信はわずか14分で、往年の大々的な発表イベントの中から抜き出された一部分のようでした。OpenAIは更新されたモデルや製品を発表し、ハイライトもありましたが、その意欲はやや不十分でした。

業界では、これは華麗なマーケティング戦略のように見えます。誰かが冗談を言いました。「OpenAIがあなたに12日間の科学技術ニュースのヘッドラインを独占する方法を教えます。」

  整理してみると、今回のOpenAIの主な話題は2つあります:

1. o1正式版の導入。これは、多様なモーダル能力と新しい推論パラダイムを組み合わせたバージョンです。o1 previewと比べて、よりスマートで、応答速度が著しく向上しています。現在、o1モデルはすでに全面展開され、API機能も近々リリースされます。

新しいプロフェッショナル版パッケージ、ChatGPT Proがリリースされ、月額200ドルのサブスクリプション料金で、ユーザーは音声機能を含むOpenAIのモデルに無制限にアクセスできます。また、Proパッケージにはo1 Proモードが導入されており、数学、科学、コーディングなどのチャレンジングな機械学習ベンチマークテストでより優れたパフォーマンスを発揮しています。

  1.O1正式版ではマルチモードが導入されています

正式版のo1モデルは、以前のo1-previewバージョンを置き換えます。

オルトマンによると、o1モデルは米国数学大会(AIME 2024)での正確性が83.3%に達し、o1プレビューの56.7%やGPT-4oモデルの13.4%を大幅に上回りました。

プログラミングの面では、o1モデルはCodeForcesコンテストで89.0%のスコアを獲得し、o1-previewは62.0%、GPT-4oはわずか11.0%であることがわかります。これにより、o1モデルは熟練したプログラマのように複雑なコーディングタスクを処理できることがわかります。

GPQA Diamond博士レベルの科学的問題テストでは、これらの問題は基本的に「地獄級」の難易度であり、o1は人間の専門家を上回る78.3%の正答率を達成しています。一方、人間の専門家は69.7%の得点を獲得しています。しかし、o1のパフォーマンスはo1 previewほどではありません。これは問題のタイプに基づくモデルのパフォーマンスまたは使用されたトレーニングデータの変更に起因する可能性があります。

新しいモデルは処理速度も改善されています。以前のバージョンと比較して、簡単な問題への反応時間が短縮されました。オルトマンはデモで、新しいo1モデルは複雑な問題の処理においてエラー率が34%ドロップし、問題の難易度に応じて処理時間を調整できると述べています。

同時、o1はマルチモーダル機能を導入しており、さまざまなタイプの入力と出力を処理できます。構造化された出力と開発者メッセージの機能が追加され、モデルの相互作用性と実用性が向上しています。

発表会で、o1モデルの責任者が現場で草案を描き、宇宙データセンターに太陽エネルギーを集めて供給するシステムを展示しました。宇宙では水冷却システムを使用できないため、放熱は巨大な放熱板に依存する必要があります。研究者はその後、o1モデルに尋ねました。このデータセンターに1ギガワットの電力を供給するには、GPUアレイを正常に動作させるためにどれだけの面積の放熱板が必要ですか。

o1模型はスケッチを正確に識別し、詳細な分析と計算を経て、242万平方メートルの巨大なヒートシンクが必要であるという結論に至りました。

  2. ChatGPT Pro が月額 $200

以前の「高額な料金」バージョンの噂も、今日やってきました。

ChatGPT Proは、月額$200の高度なサブスクリプションプランで、ユーザーに最先端のモデルやツールへの無制限のアクセス権を提供します。これには、OpenAI o1およびo1-mini、GPT-4o、Advanced Voiceへの包括的なアクセスが含まれており、主に最も複雑な計算要件に対応しています。

ChatGPT Proの特徴の1つは、o1 Proモードを導入し、計算リソースを投入して、モデルが難しい問題についてより深く考え、分析できるようにしました。このサービスは、高度なデータ分析と処理を必要とする研究者、エンジニア、および他の専門家を対象としており、彼らが効率を向上させ、人工知能技術の最前線にいることを支援します。

外部の専門家による評価によると、o1 proモードは、複雑なデータサイエンス、プログラミング、およびケース分析問題を処理する際に、従来のモデルよりも正確で包括的な応答を提供できることがわかっています。数学、科学、プログラミングなどの機械学習ベンチマークテストでは、o1 proモードのパフォーマンスがo1およびo1-previewモデルを上回っています。

o1 pro模式の主要な利点である信頼性を強調するために、OpenAIはより厳格な評価設定を使用しています:モデルが4回の試行中に4回問題に正しく回答できる場合にのみ("4/4 可靠性")、問題が解決されたとみなされます。

みんなクリスマス前に「急いで作業する」ような感じですが、Google Deepmindも昨日、最新の基本ワールドモデルGenie 2を発表しました。Anthrophicもクリスマス前に新しいモデルを発表する可能性があります。

新しいAIモデル対決のラウンドが再び始まりそうです。

  これから11日間の「ミステリーボックス」があります。以前、Soraモデル、Dall-e 4などが発売されると予想されています。OpenAIがさらに多く、より硬い商品を提供することを望んでいます。
GPT1.47%
原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
0/400
コメントなし
  • ピン
いつでもどこでも暗号資産取引
qrCode
スキャンしてGateアプリをダウンロード
コミュニティ
日本語
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)