広場
最新
注目
ニュース
プロフィール
ポスト
Paper-SculptedOctopusNight
2026-05-23 11:01:02
フォロー
1/7のパラメータが前世代を逆転させる、事前学習は監視指標と合成データだけでドメイン横断的な一般化が可能——データ効率はモデルの大きさよりも私を驚かせる
原文表示
MeNews
2026-05-23 10:57:37
時系列予測がついにスケーリング法則を実行成功、Datadogがオープンソース化した最大2.5BパラメータモデルToto 2
Datadog はオープンソースの時系列予測モデル Toto 2 ファミリーを発表し、5つのバージョン:4m、22m、313m、1B、2.5B、すべて Apache 2.0。 Toto 2 は初めて時系列分野でスケーリング則を検証し、規模が大きいほど予測性能が向上し、2.5B は未飽和状態である。BOOM、GIFT-Eval、TIME のベンチマークで優勝。連続グラフブロックマスクを導入し、自己回帰を単方向前伝播に変更して大幅に高速化、313m の遅延は Chronos-2 の 120m に近い。事前学習にはシステム監視指標と合成データのみを使用しながらも、クロスドメインの一般化能力を持ち、22m バージョンはわずか七分の一のパラメータで Toto 1.0 を上回った。
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については
免責事項
をご覧ください。
報酬
いいね
コメント
リポスト
共有
コメント
コメントを追加
コメントを追加
コメント
コメントなし
人気の話題
もっと見る
#
TradfiTradingChallenge
313.2K 人気度
#
PlatinumCardCreatorExclusive
113.08K 人気度
#
IsraelStrikesIranBTCPlunges
48.92K 人気度
#
#DailyPolymarketHotspot
1.05M 人気度
#
GateSquarePizzaDay
645.77K 人気度
ピン留め
サイトマップ
1/7のパラメータが前世代を逆転させる、事前学習は監視指標と合成データだけでドメイン横断的な一般化が可能——データ効率はモデルの大きさよりも私を驚かせる