嘲笑「AI万能药」的SubQ发布1.1版:邀请第三方评测自证,却被指夹杂AI套话

robot
概要作成中
据动察 Beating 監測、曾宣称計算消耗を千倍削減できると主張した論争の大規模モデル SubQ がバージョン 1.1 Small(小パラメータ)技術レポートを公開しました。

早期プレビュー版は論文や独立検証が不足しているため、コミュニティから「AI万能薬」(虚偽の宣伝を意味する)と揶揄される中、開発会社の Subquadratic は評価パートナーの Appen と共同で三者評価を実施し、モデルは 1200 万トークンの極限長さで 98% の検索精度を達成し、実戦的なプログラミングテストでも主流の最先端モデルに近い成績を収めたと主張しています。技術レポートはまた、モデルは最初から訓練されたものではなく、オープンソースの最先端モデルを基に、注意力計算メカニズムを置換し、インクリメンタルトレーニングで 1 兆トークンを追加して改造されたことも明らかにしています。

たとえ第三者評価で証明されたとしても、開発者コミュニティは今回のアップデートに対して依然として疑念を抱いています。ある研究者は、いわゆる「ブラックテクノロジー」は実際には基盤技術の突破ではなく、長文を小さなブロックに分割して動的に選別する既存の技術(すなわちブロック疎注意メカニズム)に過ぎないと指摘しています。また、読者からは、技術レポートに AI 生成の文章のテンプレートが混入している(特に 5.7.1 章で顕著)との批判もあります。システムエンジニアは、選別メカニズムは複数人が同時に使用する場合に追加のスケジューリングオーバーヘッドを引き起こし、最も遅い 1% のユーザーに深刻な遅延をもたらす可能性があると警告しています。

モデルはコアパラメータを公開せず、誰でも使える API も提供していないため、いわゆる計算コスト削減と超低価格の約束は依然として紙面上の話にとどまっています。
原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
コメントを追加
コメントを追加
コメントなし