智谱GLM-5.2でAAインテリジェンス指数のオープンソース第一位:GDPvalのスコアとGPT-5.5と肩を並べる

robot
概要作成中
金色财经報道、智譜 AI 最新 MoE フラッグシップモデル GLM-5.2 は、Artificial Analysis 大規模モデルインテリジェンス指数 v4.1 の評価で51点を獲得し、MiniMax-M3(44点)、DeepSeek V4 Pro(最大44点)、Kimi K2.6(43点)を超え、世界のオープンソースモデルランキングのトップに立った。
実世界の知識作業を模擬した GDPval-AA v2 テストでは、GLM-5.2 は1524点(人間基準点1000点)を獲得し、MiniMax-M3(1418点)やDeepSeek V4 Pro(最大1328点)をリードし、閉源の最先端大規模モデル GPT-5.5(xhigh reasoning)と肩を並べた。前世代のGLM-5.1と比較して、科学推論 CritPt は16ポイント向上して21%、HLEは12ポイント向上して40%、TerminalBench v2.1は16ポイント向上して78%、GPQA Diamondは89%に達した。
GLM-5.2は「インテリジェンス - タスクコスト」のパレートフロンティアで最良のコストパフォーマンスを占めている。1回のタスク平均出力は43kトークン(GLM-5.1は26k)であり、GLM-5.2の単一タスク平均コストは約0.46ドルに上昇した。これはGLM-5.1(0.25ドル)やDeepSeek V4 Pro(最大0.05ドル)より高いが、同じインテリジェンス階層の閉源モデルよりは依然として低い。
GLM-5.2の総パラメータは744B、アクティブパラメータは40Bであり、前世代の200Kから1Mに拡大したコンテキストウィンドウを持ち、MITライセンスの下でオープンソース化されている。現在、智譜公式API(価格は入力1.4、出力4.4 / 毎百万トークン)やSiliconFlow、DeepInfra、Nebius AIなどのプラットフォームでサービスが展開されている。
原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
コメントを追加
コメントを追加
コメントなし