Безперервне маскування блоків перетворено з автогресивного на односторонній прямий прохід, затримка зменшена до 313м, що відповідає Chronos-2 з 120м, технічні деталі важливіші за стек параметрів

Переглянути оригінал
MeNews
Послідовне прогнозування нарешті запустило Scaling Law, Datadog відкриває модель з максимальною кількістю 2,5 мільярда параметрів Toto 2
Datadog оголосила про відкриття вихідного коду часової передбачувальної моделі Toto 2 сімейства, п’ять версій: 4м, 22м, 313м, 1B, 2.5B, всі під ліцензією Apache 2.0. Toto 2 вперше в галузі часових рядів підтверджує закон масштабування: чим більший масштаб, тим сильніше передбачення, 2.5B ще не насичена; перемоги на бенчмарках BOOM, GIFT-Eval, TIME. Введено безперервний маскувальний блок графа, що перетворює автоградієнтний режим у односторонній прямий прохід, що значно прискорює процес, затримка для 313м близька до Chronos-2 з 120м. Попереднє навчання здійснювалося лише на системних моніторингових показниках та синтетичних даних, але модель все одно демонструє міждисциплінарну здатність до узагальнення, версія 22м використовує лише одну сім’яну частку параметрів і все одно перевершує Toto 1.0.
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріплено