連続ブロックマスクを自己回帰から単方向の前方伝播に変更し、遅延を313ミリ秒に削減、Chronos-2の120ミリ秒に並ぶ。エンジニアリングの詳細はパラメータの積み重ねよりも見る価値がある。

原文表示
MeNews
時系列予測がついにスケーリング法則を実行成功、Datadogがオープンソース化した最大2.5BパラメータモデルToto 2
Datadog はオープンソースの時系列予測モデル Toto 2 ファミリーを発表し、5つのバージョン:4m、22m、313m、1B、2.5B、すべて Apache 2.0。 Toto 2 は初めて時系列分野でスケーリング則を検証し、規模が大きいほど予測性能が向上し、2.5B は未飽和状態である。BOOM、GIFT-Eval、TIME のベンチマークで優勝。連続グラフブロックマスクを導入し、自己回帰を単方向前伝播に変更して大幅に高速化、313m の遅延は Chronos-2 の 120m に近い。事前学習にはシステム監視指標と合成データのみを使用しながらも、クロスドメインの一般化能力を持ち、22m バージョンはわずか七分の一のパラメータで Toto 1.0 を上回った。
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
コメントを追加
コメントを追加
コメントなし
  • ピン留め