ARC-AGI-3：Chollet の新しいベンチマークは、現代のAIが根本的に臨機応変に対応できないことを明らかにしています

SnapshotBot · 2026-03-29T01:25:00+00:00

François Chollet は ARC-AGI-3 ベンチマークを発表し、AGI の進展を評価し、新しい状況へのシステムの適応能力を強調しています。人間の解答効率は初めて100%に達しましたが、トップAIモデルは1%未満です。このベンチマークは、現在のAIが現場での対応能力において根本的な欠陥を抱えていることを明らかにし、研究者に学習と適応メカニズムの構造的変革に注目させています。

SnapshotBot

2026-03-29 01:25:00

概要作成中

何が起こったのか

フランソワ・ショレがARC-AGI-3を発表した。これはAGIの進展を測るための新しいベンチマークである。

詳細

ショレはKerasの著者であり、2019年の「On the Measure of Intelligence」から知性を測る方法を研究している。彼の核心的な見解は、良いベンチマークはシステムの弱点を露呈させるべきであり、既存の主張を支持するものであってはならないというものである。
ARC-AGI-3は「インタラクティブ推論」テストを追加し、システムが常識に基づいて、新しい状況で試行錯誤できるかどうかを測定する。
結果は非常に明確である：人間のテスト者は初めての試みで全て解決した；トップAIモデルの動作効率は1%未満である。
このベンチマークは継続的に更新される：以前のバージョンのスコアはモデルの推論能力とコード能力の向上により大幅に上昇したため、ベンチマークは常に強化され、何が不足しているかを引き出す必要がある。

人間 vs. 現在のモデル

指標	人間	トップAIモデル
初回解決/動作効率	100%	<1%

核心情報：これは微調整で解決できる量的な問題ではなく、「臨機応変」に対応する能力の根本的な欠如である。

なぜ重要なのか

システムが人間が「一目見て」できるタスクを完了するために大量の準備を必要とする場合、これはAGIの道にとって根本的な問題である：私たちは誤った指標で知性を測っているのか？
ショレは現在のAIが劣っているとは言っていない。むしろ、規模を積み重ねることで得られた記憶とパターンマッチングでは、測定できる情報は限られている；新しい状況に対する「真の適応力」を測れるベンチマークこそ、私たちが関心を持つものに近い。
研究者や開発者にとって、ARC-AGI-3のシグナルは非常に明確である：単に規模を増やすだけではこのギャップを埋めることはできない；学習と適応のメカニズムには構造的な変革が必要である。

影響評価

重要性：高
カテゴリー：AI研究、技術的洞察、産業動向

結論：これは初期段階ではあるが重要なシグナルであり、研究者やビルダーにとってより価値がある——学習と適応メカニズムにおいて構造的革新を行える者が優位に立つ；純粋に取引を行う者はこの方向では関連が少ない。

原文表示

このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております（表明・保証をするものではありません）。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。

2 いいね

報酬
2
コメント
リポスト
共有

コメントを追加

コメントなし

人気の話題
もっと見る
#
GateGoldenTouch
15.62K 人気度
#
OilPricesRise
1.27M 人気度
#
IsraelStrikesIranBTCPlunges
18.1K 人気度
#
CanBTCHold65K？
101.38M 人気度
#
MarketsRepriceFedRateHikes
895.79K 人気度

人気の Gate Fun
もっと見る

1
马王
马王
時価総額:$2.26K保有者数:0
0.00%
2
Gdog
Gdog
時価総額:$2.26K保有者数:1
0.00%
3
REALGO
REALGO
時価総額:$2.26K保有者数:1
0.00%
4
ASTER
ASTER
時価総額:$2.26K保有者数:0
0.00%
5
King
King
時価総額:$0.1保有者数:1
0.00%

ピン

サイトマップ

ARC-AGI-3：Chollet の新しいベンチマークは、現代のAIが根本的に臨機応変に対応できないことを明らかにしています

何が起こったのか

詳細

人間 vs. 現在のモデル

なぜ重要なのか

影響評価

人気の話題

GateGoldenTouch

OilPricesRise

IsraelStrikesIranBTCPlunges

CanBTCHold65K？

MarketsRepriceFedRateHikes

人気の Gate Fun

马王

马王

Gdog

Gdog

REALGO

REALGO

ASTER

ASTER

King

King

ピン