#OpenAIReleasesGPT-5.5


#OpenAIReleasesGPT-5.5 今日のサプライズ発表で、OpenAIは正式にGPT-5.5を発表しました。これは同社の主力大規模言語モデルの最新バージョンです。GPT-4の基盤とGPT-4 TurboやGPT-4oで見られた段階的な改良を土台にしており、この新リリースは人工知能の能力において大きな飛躍を示しています。ChatGPT Plus、Team、Enterpriseのユーザーは即座に利用可能で、APIアクセスは今後2週間で展開される予定です。GPT-5.5は、企業、開発者、日常ユーザーがAIとどのように対話するかを再定義することを約束します。

新しいアーキテクチャ:スパース・ミクスチャー・オブ・リーズニング・エキスパート

GPT-5.5の中心には、OpenAIが内部で「スパース・ミクスチャー・オブ・リーズニング・エキスパート」(SMoRE)と呼ぶ完全に刷新されたアーキテクチャがあります。従来のモデルが単一の巨大ニューラルネットワークに依存していたのに対し、GPT-5.5はクエリの性質に応じて専門のサブネットワーク、つまり「エキスパート」を動的に活性化します。数学的な問題には論理専用のエキスパートに計算をルーティングし、創造的な文章作成には物語に焦点を当てたモジュールを、コーディングには数十億行のソースコードで訓練された記号的推論エンジンを使用します。

このアーキテクチャの変化は二つの大きな利点をもたらします。第一に、推論速度はGPT-4 Turboと比べて約40%向上し、モデルのパラメータは2兆を超えています。第二に、より重要な点として、事実や数値に関するタスクでの幻覚(誤情報)の発生率が劇的に低減します。内部ベンチマークでは、架空の引用の削減率が62%、多段階の計算問題における算術の一貫性が71%改善されました。

拡張されたコンテキストウィンドウ:すべてを記憶

GPT-5.5は、512,000トークンのコンテキストウィンドウを導入しています。これはGPT-4 Turboの128,000の2倍であり、GPT-4oの256,000よりもはるかに大きいです。実用的には、モデルは全てのハリー・ポッターシリーズ((例:全七巻))のような長大な書籍シリーズ、数千ページにわたる法的契約、または大規模ソフトウェアプロジェクトのコードベースを一度に処理できます。さらに重要なのは、この拡張されたコンテキストに対するモデルの記憶精度が飛躍的に向上したことです。以前のモデルは非常に長いプロンプトの途中で情報を「失う」ことが多かったのに対し、GPT-5.5は最大40万トークンまでほぼ完璧に情報を保持し、最大限界付近ではわずかな劣化にとどまります。

開発者にとっては、新たな可能性が開かれます。例えば、顧客サポートの全履歴を一度に分析したり、長文の研究論文を要約しながら微妙な議論を保持したり、数時間にわたる会議の記録からアクションアイテムを抽出したりできます。

マルチモーダル理解の再構築

GPT-4はビジョンAPIを通じて画像入力を提供していましたが、GPT-5.5はマルチモーダル機能を拡張し、ネイティブな音声、映像、リアルタイムの画面理解を可能にします。モデルは最大30秒の動画クリップを直接受け入れ、物体や動作、顔の表情から微妙な感情の手がかりまで識別します。音声入力は単なる音声認識を超え、話者の識別、トーン、背景ノイズ、感情の抑揚を認識し、緊急性や皮肉をフラグ付けします。

最も印象的なのは、「統一されたマルチモーダル推論」を導入した点です。異なるモダリティからの入力を組み合わせて複雑な質問に答えることができるのです。例えば、散らかった机の写真、壊れたプリンターの短い動画、「ギシギシと音がする」と言う音声メモを与えると、GPT-5.5は紙詰まりの可能性を診断し、動画のスクリーンショットを注釈付きで示しながら修理手順を段階的に生成します。この能力は遠隔の技術サポート、医療診断(症状の記述と画像の両方を分析)、教育などに即座に応用可能です。

ツールの使用とエージェント的ワークフロー

GPT-5.5の大きなテーマの一つは、エージェント的タスクへのネイティブサポートです。モデルは、外部アプリケーション上で複雑なオーケストレーションコードを書かずに、多段階の計画、実行、検証を行えるようになっています。Slack、GitHub、Google Workspace、Salesforceなどの人気サービス用のコネクタが内蔵されており、ユーザーの許可を得た後、これらのプラットフォームから直接読み書きが可能です。
#OpenAIReleasesGPT-5.5
例えば、ユーザーは「Zendeskの‘緊急’タグ付きサポートチケットを見て、最も重要な3つを要約し、それぞれに返信案を作成し、明日のリマインダーをカレンダーにスケジュールして」と依頼できます。GPT-5.5はこれをサブタスクに分解し、適切なAPIを呼び出し、一つの結果として提示します。もしエラー(例:特定のチケットの読み取り権限がない場合)が発生した場合は、黙って失敗せずに確認を求めます。

このエージェント的動作は、「計画トランスフォーマー」層によって支えられています。これは内部で依存関係や分岐結果について推論を行います。OpenAIの技術ブログによると、モデルは人間のタスク分解やツール使用の何百万もの例で訓練され、その後、エージェント的フィードバック(RLAIF)を用いた強化学習で微調整されました。安全性確保のため、外部呼び出しはデフォルトでユーザーの確認を必要とし、「自動承認」モードも設定可能です。

効率とコスト:少ないリソースでより多くを実現

能力が向上しているにもかかわらず、GPT-5.5はGPT‑4 Turboよりも実行コストが低く抑えられています。OpenAIは、より良い量子化技術、推測デコード、SMoREアーキテクチャのスパース性によるものだと説明しています。APIの料金は$15 百万入力トークンあたり$30 百万出力トークンあたりで、GPT‑4 Turboの$20/$40 レートから25%削減されています。ChatGPTのPlusサブスクリプションは従来通り月額ですが、利用制限$20 メッセージ数/時間(は、効率向上により50%増加しています。

さらに、OpenAIはGPT-5.5の「ライト」バージョン、GPT-5.5 Liteも導入します。これは、パラメータ数7億の軽量モデルでありながら、同じアーキテクチャの革新を保持し、高性能スマートフォンやエッジサーバー上で動作可能です。LiteはほとんどのタスクでGPT-3.5と同等の性能を発揮しつつ、遅延が少なく、完全なプライバシー)すべての処理がローカルで行われる(を実現します。これにより、飛行機内でのリアルタイム翻訳、病院のタブレットでのプライバシー重視の文書分析、遠隔地の開発者向けのオフラインコーディング支援などのユースケースが可能になります。

安全性と整合性:展開から得た教訓

GPT-5.5の自律性の向上に伴い、OpenAIは安全性に多大な投資を行っています。新たな「憲法エージェント」がメインモデルと並行して動作し、入力と出力の両方を継続的に監視し、ポリシー違反や有害な指示、脱獄の試みを検知します。このエージェントは単なるプロンプトフィルターではなく、リクエストの文脈や意図について軽量な推論を行います。潜在的な違反を検知した場合、基本モデルの応答を上書きし、安全な拒否を代替し、レビューのために記録します。

初期テストでは、このシステムによりGPT‑4 Turboと比べて脱獄成功率が96%削減されました。特に、多段階攻撃に対して効果的で、ユーザーが徐々にモデルをガイドしてガイドラインを無視させる攻撃に対しても堅牢です。憲法エージェントはまた、個人識別情報)PII(の自動編集「デフォルトでのリダクション」も導入しています。ユーザーの入力やモデルの出力に含まれるPIIは、明示的な許可がない限り自動的に削除されます)例:医療や法的な文脈で必要な場合(。

もう一つの注目すべき機能は、長文生成コンテンツに対する「出力ウォーターマーク」です。暗号技術を用いて、GPT-5.5は生成したすべての内容に不可視のマークを付与します。第三者ツールはこれらのウォーターマークを99.9%の精度で検出でき、教育者、ジャーナリスト、プラットフォームがAI生成テキストを識別するのに役立ちます。従来のウォーターマークと異なり、この方法はパラフレーズや翻訳に対しても堅牢ですが、OpenAIは、意図的に除去しようとする敵対者がいる可能性も認めています。

ベンチマーク性能:最先端の全方位

学術機関や業界パートナーによる独立評価は、GPT-5.5が新記録を樹立していることを確認しています。MMLU)大規模多タスク言語理解(ベンチマークでは、92.7%)(GPT‑4の86.4%から向上)を記録。GSM8K(小学校算数)では97.2%の正答率を達成。HumanEval(コーディング)では89.5%のテストに合格し、人間の専門家レベルに近づいています。多言語タスクでは、スワヒリ語、ナバホ語、アイスランド語などの資源の少ない言語で特に強みを示し、200言語をカバーする5000億トークンの新コーパスを活用しています。

最も注目すべきは、「不確実性下の推論」新ベンチマークでのパフォーマンスです。確率的思考とキャリブレーションを必要とし、GPT-5.5は実際の正答と驚くほど良く一致する信頼度スコアを生成します(相関係数0.94)。これは、「知らないときは知らないと認める」ことを意味します。対照的に、GPT‑4は難問に対して過信しやすかったです。このキャリブレーションにより、GPT-5.5は医療診断、金融分析、法的調査などの高リスク用途において、より信頼性の高いモデルとなっています。

提供状況、価格設定、今後のロードマップ

GPT-5.5は本日展開開始です。ChatGPT PlusおよびTeamのサブスクライバーは、ウェブやモバイルのモデルドロップダウンメニューから「GPT-5.5」を選択するだけで即座にアクセス可能です。無料版のChatGPTは引き続き軽量版のGPT‑4oを使用しますが、OpenAIは2025年第1四半期にGPT-5.5の蒸留版を無料ユーザーに提供する予定です。

API開発者向けには、gpt-5.5-turbo-2024-11という名称で提供されます。OpenAIは最初の30日間、(百万入力トークンあたり)のプロモーション料金を設定しています。ファインチューニングサポートは2025年1月に追加され、企業はLoRAのようなパラメータ効率的な手法を用いて自社データに基づきモデルをカスタマイズ可能です。

将来展望として、OpenAIのMira Murati CTOは、GPT-5.5がGPT‑5の前の最後の大きなリリースになると示唆しています。GPT‑5は継続学習$5 知識のアップデートを完全な再訓練なしで行う能力(や複数AI間の協調を取り入れると予想されています。「私たちはGPT-5.5を、今後2年間にわたってほとんどのユースケースに対応できる成熟した安全で強力なワークホースと見ています」と彼女はローンチイベントで述べました。「GPT‑5が登場するときは、まったく異なるものになるでしょう。モデルというよりエコシステムです。」

潜在的な懸念と批判
)
どの大規模AIリリースも議論を呼ぶものです。早期テスターは、GPT-5.5が長いリストの評価においてGPT‑4よりも「ポジションバイアス」が強くなる傾向があると指摘しています。特に、リストの前半に記載された項目を好む傾向があり、後半の項目が客観的に優れていてもそうなるとのことです。OpenAIはこれを認めており、次週のアップデートで修正を行うとしています。#OpenAIReleasesGPT-5.5
原文表示
post-image
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • 4
  • リポスト
  • 共有
コメント
コメントを追加
コメントを追加
Dubai_Prince
· 3時間前
自分で調査してください 🤓
原文表示返信0
Dubai_Prince
· 4時間前
自己調査を行う 🤓
原文表示返信0
Dubai_Prince
· 4時間前
購入して稼ぐ 💰️
原文表示返信0
ybaser
· 4時間前
月へ 🌕
原文表示返信0
  • ピン