Одна седьмая параметров противодействует предыдущему поколению, предварительное обучение можно осуществлять только с помощью мониторинговых показателей и синтетических данных, обеспечивая межотраслевую обобщаемость — эффективность использования данных меня удивляет больше, чем размер модели

Посмотреть Оригинал
MeNews
Временной прогноз наконец-то прошел тест масштабирования, Datadog выпустил с открытым исходным кодом модель Toto 2 с максимальным количеством параметров 2,5 миллиарда
Datadog объявила о выпуске открытой модели временного ряда Toto 2 семейства, включающей пять версий: 4м, 22м, 313м, 1B, 2.5B, все лицензированы по Apache 2.0. Toto 2 впервые в области временных рядов подтвердил закон масштабирования, чем больше масштаб, тем лучше прогнозирование, 2.5B не достигла насыщения; заняла первые места в бенчмарках BOOM, GIFT-Eval, TIME. Введена непрерывная маска блоков графа, заменив автогрессорный механизм односторонним прямым проходом, что значительно ускоряет работу, задержка версии 313м близка к Chronos-2 с 120м. Предварительное обучение проводилось только на системных метриках мониторинга и синтетических данных, сохраняя междисциплинарную обобщающую способность, версия 22м использовала всего одну седьмую параметров Toto 1.0 и при этом превосходила её.
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Закреплено