GPT-5.4 Proは、OpenAIが自己記録を更新し、MESNAノルウェーテストで150 IQに跳躍

CryptoSlate が で優先されるように設定

OpenAIの最新GPT-5.4 Proモデルは、すでに全人間の99.96%より高いIQスコアを達成しており、AI能力の伸びが従来のプロダクト・サイクルに伴うノイズを上回り始めていることを、市場に新たなシグナルとして示しています。

OpenAIのGPT-5.4 Proは公的なIQベンチマークで150に到達、市場は別のマクロ重めの週へ

TrackingAIの公開リーダーボードでは、OpenAIのGPT-5.4 ProがIQスコア150となっており、昨年Mensa NorwayのテストでOpenAIのo3が記録した136から大きくステップアップしています。

この跳躍は、市場の注目がイラン、エネルギー、労働の弱さ、そして次のインフレ指標へと絞られているタイミングで訪れます。すると、今週先の別の問いが生まれます。機械知能はどれくらいの速さで複利的に伸びていくのか、そしてその加速はいつ、経済面でのポジショニングと重なり始めるのか――。

なぜ重要か:広く理解されているベンチマークで136から150へ動くことは、複雑な能力の変化を単純なシグナルに圧縮します。企業にとって、そのシグナルは自動化、ソフトウェア予算、そして人員計画に関する意思決定へ直結します。市場にとっては、金利、インフレ、成長期待と並ぶもう1つの変数になります。

OpenAIは、専門的な仕事のための最も高性能で効率的なフロンティアモデルとしてGPT-5.4を導入しました。コーディング、ツールの利用、コンピュータ利用がより強力で、最大1,000,000トークンのコンテキストウィンドウを備えています。同じリリースの中で、OpenAIはGPT-5.4がGDPvalで新たな最先端の状態を達成し、OSWorld-Verifiedでも人間のパフォーマンスを上回ったと述べています。

これらのベンチマークは公開IQテストとは別物ですが、進む方向性は一致しています。能力は、別々の測定システムを通じて上昇しており、その上昇は、予算編成、採用計画、ワークフロー設計、そしてソフトウェア支出へ影響を与えるほどの速さになってきています。

公開IQスタイルのベンチマークで150というスコアは、より広範な能力の転換を、単一で持ち運べるシグナルに圧縮します。この数値は、手法が議論される前でも理解しやすいのです。

先行していたo3のMensa結果は、そのベンチマークとその限界を明確にしました。GPT-4.1の100万トークンのコンテキストウィンドウは、OpenAIが長期のコードやドキュメント作業にわたってモデルの有用性を拡張していることを示しました。一方で、私たちのOpenAIが拡大する資本ループに関する分析では、モデルの進歩を、ハードウェア拡張、ファイナンスのループ、そしてインフラ需要と結びつけました。

これらを合わせると、最新のIQスコアは、より広い商業的・経済的な文脈の中に位置づけられます。公開ベンチマークで136から150への動きは、それだけでも印象的です。さらに、136から150へ動くことが、OpenAIがツール利用、コンピュータ利用、エンタープライズの生産性、そして資本集約的なインフラへより深く踏み込んでいる最中に起きているなら、その含意はより広がります。

公開IQベンチマークには限界がありますが、能力のカーブはそれでも上向きに動いている

公開IQスタイルのテストは、フロンティアモデルを測るための完璧な計測器ではありません。TrackingAIは公開Mensa方式のベンチマークを実行しており、さらに、より厳しい非公開のオフラインテストも維持しています。

IQスタイルのテストは、認知能力の狭い一部を単一の数値に圧縮し、推論タイプごとのばらつき、コンテキストの扱い、創造性、そして現実世界での問題解決の差を見えなくしてしまいます。

AIにとっても人間にとっても、スコアはテスト設計、訓練への露出、そしてパターンへの馴染み度に敏感です。だからこそ、それは一般的な能力の、ノイズの多い代理指標になってしまいます。

IQ 150は分布の極めて上側の裾であり、しばしばアルベルト・アインシュタインやリチャード・ファインマンのような個人と結びつけられます。実務的には、それは非常に速い抽象化、強いパターン認識、そして限られたガイダンスのもとで複雑な多段階の問題を切り抜ける能力を意味するものです。

プラットフォームは、直近の完了結果に基づくローリング平均としてスコアを報告しており、その手法はおなじみの疑問――プロンプト構造、再現性、トレーニングセットの混入(コンタミネーション)、そしてフォーマットへの馴染み――を引き起こします。これらの懸念は、o3が136に到達した時点ですでに見えていました。そして、GPT-5.4 Proが150に位置している今も、それらはなお有効です。

関連記事

OpenAIのo3はMensa Norwayテストで136を記録し、98%超の人間の母集団を上回る

OpenAIのo3モデルは、独立テストでMensaレベルのIQに到達します。

2025年4月17日 · Liam ‘Akiba’ Wright

これらの限界があっても、より大きなパターンは無視しにくくなっています。1つの孤立したベンチマーク結果は、単なる癖として片づけられるかもしれません。しかし、公的なIQスタイルのテスト、コーディング、ブラウザ利用、デスクトップのナビゲーション、そしてナレッジワークのパフォーマンスにまたがる一連の伸びには、より大きな分析上の重みがあります。

TrackingAIの最新リーダーボードでは、GPT-5.4 Proが公開IQボードのトップに位置し、Cluade、Gemini、Qwen、Grok各モデルを含むあらゆるモデルを上回っているとされています。これは、より外部で判読しやすい公開ベンチマークであり、広い意味での能力に関する議論に素早く対応づけられます。

150が稀な範囲にあることを理解するのに、ベンチマーク設計を詳細に理解する必要は多くありません。また、投資家がIQスタイルのテストの前提をすべて受け入れる必要もなく、それでも、この規模の跳躍がドリフトではなく加速を示唆していることは認識できるはずです。

「AI IQ Test Results」と題されたチャートで、主要なAIモデルの平均Mensa Norway IQスコアをベルカーブ上に示し、OpenAIのGPT-5.4バリアントが範囲の上端付近にプロットされています。

エンタープライズの買い手にとっても、IQが一般知能に等しいと信じる必要はありません。より強いパターン認識、より強いツール利用、そしてより強い長期ホライズンのタスク処理を備えたシステムが、パズル解きの域をはるかに超えて、経済的に有用な領域へ移行しつつあることは見て取れます。

これは、拡張された文脈のもとで検索し、計画し、検証し、ナビゲートし、そして実際の仕事を生み出せるようなシステムへ向かう流れを示しています。このような環境では、IQスコアは新奇性の数字というより、フロンティア推論の密度を示すシグナルとして機能します。

また、リーダーボードそのものにも競争上の価値があります。公開ベンチマークでのリーダー的な位置は、可視化された能力のリーダーシップを巡る競争の中でOpenAIの立ち位置を補強します。特に、モデルの差異化がアーキテクチャの注記だけでは判別しにくくなりつつあるこのタイミングにおいてです。

ベンチマークのリーダーシップは、複雑さを単純な序列へ圧縮します。開発者にはシグナルを、エンタープライズの買い手には筋書き(ナラティブ)の手がかりを、投資家には、能力フロンティアが現時点でどこにあるかを示すもう1つの代理指標を提供します。

CryptoSlate Daily Brief

毎日のシグナル、ゼロノイズ。

毎朝、短く読み切れる形で、市場を動かす見出しと文脈をお届けします。

5分で読む 10万人+の読者

メールアドレス

ブリーフを受け取る

無料。スパムなし。いつでも購読解除できます。

うわっ、問題が起きたようです。もう一度お試しください。

登録しました。ようこそ。

OpenAIのベンチマーク上昇は、これからの経済的な週と重なり始めている

今週先も、マクロの流れは続きます。米労働統計局(Bureau of Labor Statistics)のカレンダーには、次の重要な発表がはっきりと記されています。4月8日発表予定の、3月17日〜18日の会合に関するFOMC議事要旨。4月10日発表予定の、3月の消費者物価指数(Consumer Price Index)。そして4月14日発表予定の、3月の生産者物価指数(Producer Price Index)です。

このスケジュールが、金利、インフレ、成長への不安を前面に置き続ける一方で、その表面の下では、第2の経済トラックが形になりつつあり、OpenAIはその中心付近にいます。

フロンティアAIにおける能力の成長は、ますます資本配分と交差しています。公的な推論テストでより高い水準を押し上げつつ、コーディング、検索、コンピュータ利用でも改善するモデルは、企業がワークフローの再設計をどう考えるかを変えます。それは、コパイロットやエージェントに対してソフトウェアの買い手が何を期待するかを変えます。そして、それは企業が実験から導入へ移る速度も変えます。

ジャック・ドーシーは最近、Blockが「階層からインテリジェンスへ移行している」と投稿しました。個々の貢献者、直接責任を負う個人、そしてプレイヤーコーチを中心に会社を再編する中で、AIを使って、これまで管理層が担っていた調整業務を引き継ぐのだということです。

能力の成長はまた、どのタスクを労働コストの構造から切り出してソフトウェアへ再割り当てできるかも変えます。これらの影響はまず、より狭いチャネル――文書ワークフロー、スプレッドシートのワークフロー、カスタマーサポート、リサーチタスク、ブラウザ自動化、社内オペレーション、コード生成、そして検証ループ――を通じて広がっていきます。

OpenAIの商業的な方向性は、その解釈を強化しています。同社のGPT-5.4ローンチ資料では、専門的な仕事におけるより強いパフォーマンス、より強いツール検索、ネイティブなコンピュータ利用、そして職業をまたいでU.S.経済に直接対応する形でマップできるベンチマーク済みナレッジワークでの伸びが、説明されています。

つまり、AI能力の成長は、次にどこへ支出の流れが向かうのかという、見慣れた市場の問いの中に組み込まれます。これらのシステムがこのペースで改善し続けるなら、支出の行き先はどこになるのか、ということです。

答えは、モデルのサブスクリプション収益にとどまらず、クラウド需要、チップ、データセンター、ネットワーキング、電力、ソフトウェアライセンス、そして労働生産性に関する前提へと広がります。OpenAIが拡大する資本ループは、すでにその構造の一部を反映しています。そしてベンチマークでの上積みは、その上に、より単純で対外向けのシグナルを追加します。

この重なりこそが、マクロ重めの週において今回の結果の重要性をより広くします。市場はすでにCPIの段取りを把握しています。市場は、原油価格がインフレ期待へ波及し得ることもすでに知っています。市場は、FRB(連邦準備制度)の議事要旨が政策のトーンとして解析されることもすでに知っています。

では、知能そのものの成長は、マクロ変数のように振る舞い始めているのでしょうか?より速い能力の伸びは、企業の支出計画を変え、ホワイトカラー機能全体で競争圧力を引き締め、高いインフラ投資を後押しし、名目成長が鈍い環境であってもAIに紐づく資本支出の根拠を強める可能性があります。

TrackingAIがGPT-5.4 Proを150として示すとき、その数値は、市場の中で既にOpenAIが単なる研究所以上の存在として見られている領域に収まります。OpenAIはプラットフォーム企業であり、導入(デプロイ)企業であり、インフラの顧客であり、隣接セクターに向けたシグナル生成装置でもあります。

次のテストは、2つの場所に同時にあります。1つは手法(メソドロジー)です。公開IQスタイルのベンチマークは引き続き精査の対象となるでしょうし、そうであるべきです。もう1つは経済です。市場は、能力のこの規模の跳躍が、労働データ、金利見通し、そして資本支出のトレンドと並べて価格付けされるに値するのかを、段階を追って判断していきます。

OpenAIの最新のベンチマーク上昇は、その判断をより近づけます。スコアはコンパクトで、読み取りやすく、共有もしやすい。より深い関連性は、同社のより広いプロダクト推進と同じ場所から生まれています。フロンティアはまだ上昇中であり、その上昇がもたらす経済的な足跡は、別のカテゴリーとして維持しにくくなりつつあります。

この記事で言及されているもの

OpenAI Anthropic Google X Sam Altman

掲載先

Featured US Technology Culture AI Community

コンテキスト

関連する報道

カテゴリを切り替えて、より深く掘り下げるか、より広い文脈を得てください。

US ローカルニュース      AI トップカテゴリ      プレスリリースニュースワイヤー  

Analysis

なぜビットコインはイランの合意(ディール)期待で一時$70,000を超えたのか。トランプのホルムズ危機の脅威がラリーを脆く保つ

原油は約$112で、差し迫るCPIとFRBが、この反発が生き残るのか、それともより深い下落(ドローダウン)へ変わるのかを決める可能性があります。

2分前

Analysis

シタデル・セキュリティーズとフィデリティが、ウォール街のように暗号資産を再構築するための、これまでで最も明確な動きを行った

提出(フィリング)により、機関が追随するなら、暗号資産取引のバックエンドのより多くが連邦の監督下に移る可能性があります。

4時間前

ウォール街は、ワシントンが401(k)のルールを書き換えることで$10兆の新規口が開くと見ている

Analysis · 12時間前

強い米国の雇用統計がFRBの救済を遅らせ、ビットコインは次のマクロテストに直面

Analysis · 1日前

ビットコインのトレジャリー取引は、債務圧力が売りを誘発することでストレステストに直面

Analysis · 2日前

ビットコインのデリバティブが警告点滅、$46B市場がイラン停戦ラリーから後退

Analysis · 2日前

AI

暗号AIプロジェクトのOpenServは、直接のベンチマーク比較でOpenAIに勝つと主張

AI-クリプトのプラットフォームがOpenAIに対してより大きな主張を行っており、証明(プルーフ)、導入、そしてトークンの信頼性をめぐる賭け金が引き上げられています。

2時間前

Technology

リップルは、銀行向けによりプライベートなブロックチェーンを推進し、AIコード検査を追加。成長する懸念がXRP価格に追い風を与えない可能性も

リップルは、XRPLに強化されたプライバシーとAIセキュリティ機能を備え、機関向けブロックチェーンを革新することを狙っています。

1週間前

AIの勝者はAIコインではない。エージェントが自律的に支出を始める

Analysis · 1週間前

レイオフが加速し、ある1つのグループが最も強く打撃を受ける中で、AIリセットがいま始まっている

AI · 4週間前

暗号資産は、成長する経済AIエージェントの網から私たちを守れるのか?

AI · 4週間前

AIは、よりシニアな開発者を採用しながら、それを生み出す仕事を静かに消している

AI · 1か月前

CoinRabbitは、XRPローンおよび300+のアセット向けの暗号貸付金利を引き下げ

貸付金利は現在11.95%から始まっており、CoinRabbitはXRPおよび300+のサポート対象アセットに対する、より低コストの暗号担保借り入れを拡大しています。

3時間前

ADI Chainが、FIFAワールドカップ2026の予測市場パートナーとしてADI Predictstreetを発表

ADI Chainの支援により、ADI PredictstreetはFIFAワールドカップ2026の公式予測市場パートナーとして、サッカー界最大の舞台でデビューします。

3日前

BTCC取引所が、アルゼンチン代表チームの公式地域パートナーに指名

PR · 4日前

EncryptはSolanaにやって来て、暗号化された資本市場を支える

PR · 6日前

IkaはSolanaにやって来て、ブリッジレス資本市場を支える

PR · 6日前

TxFlow L1メインネットのローンチにより、多数のアプリケーションを扱うオンチェーン・ファイナンスの新しいフェーズが始まる

PR · 6日前

免責事項

当社のライターの見解はそれぞれ本人のものであり、CryptoSlateの見解を反映するものではありません。あなたがCryptoSlateで目にする情報は、投資助言として受け取らないでください。また、CryptoSlateは、本記事で言及またはリンクされている可能性のあるいかなるプロジェクトも支持しません。暗号資産の購入および取引は、高リスクな活動とみなされるべきです。本記事内のコンテンツに関連して何らかの行動を取る前に、必ずご自身で十分なデューデリジェンスを行ってください。最後に、暗号資産の取引で損失が出た場合、CryptoSlateは一切の責任を負いません。詳細は、当社の会社免責事項をご覧ください。

原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
コメントを追加
コメントを追加
コメントなし
  • 人気の Gate Fun

    もっと見る
  • 時価総額:$2.24K保有者数:1
    0.00%
  • 時価総額:$2.24K保有者数:0
    0.00%
  • 時価総額:$2.23K保有者数:1
    0.00%
  • 時価総額:$2.24K保有者数:1
    0.00%
  • 時価総額:$0.1保有者数:0
    0.00%
  • ピン