火星财经消息 4月2日号。北京中关村学院の情報・インテリジェンス・チームが自社開発したインテリジェントエージェントシステム「Milkyway」が、FutureX評価で60.9点を獲得し、世界ランキングの首位に登り詰めました。FutureXは「AI予言能力」を特に試すための国際的な動的評価ベンチマークで、ByteDance、スタンフォード、復旦大学、プリンストン大学などの一流の学術機関が共同で立ち上げました。そのデータセットはHuggingFace上で公開されており、まだ明かされていない実際の出来事(例:地政学的な駆け引き、政策の動向、経済の変動)を通じて、AIの予測能力を検証します。今回の評価では、イーロン・マスク氏の関連会社が手がける「Grok4」のスコアは25.9点で、Milkywayのスコアはそれを大きく上回り、倍以上でした。このチームは「AIコア」学部の大規模モデル分野における鄭書新副教授が率い、次世代のAIコア能力の探求に焦点を当てています。このブレイクスルーはモデルそのものに加え、インテリジェントエージェントシステム層(harness層)における深い技術開発にもよるもので、システムが長い期間にわたって稼働できること、多数のエージェントによる協調ができること、さらに自己評価と反復的な修正を行えることを可能にしました。(火星财经消息)
北京中关村学院Milkyway智能体系统がFutureXグローバルAI予測ランキングでトップに登場
火星财经消息 4月2日号。北京中关村学院の情報・インテリジェンス・チームが自社開発したインテリジェントエージェントシステム「Milkyway」が、FutureX評価で60.9点を獲得し、世界ランキングの首位に登り詰めました。FutureXは「AI予言能力」を特に試すための国際的な動的評価ベンチマークで、ByteDance、スタンフォード、復旦大学、プリンストン大学などの一流の学術機関が共同で立ち上げました。そのデータセットはHuggingFace上で公開されており、まだ明かされていない実際の出来事(例:地政学的な駆け引き、政策の動向、経済の変動)を通じて、AIの予測能力を検証します。今回の評価では、イーロン・マスク氏の関連会社が手がける「Grok4」のスコアは25.9点で、Milkywayのスコアはそれを大きく上回り、倍以上でした。このチームは「AIコア」学部の大規模モデル分野における鄭書新副教授が率い、次世代のAIコア能力の探求に焦点を当てています。このブレイクスルーはモデルそのものに加え、インテリジェントエージェントシステム層(harness層)における深い技術開発にもよるもので、システムが長い期間にわたって稼働できること、多数のエージェントによる協調ができること、さらに自己評価と反復的な修正を行えることを可能にしました。(火星财经消息)