Пошаговая звезда полностью открыла исходный код Step 3.5 Flash: предварительное обучение и обучающие фреймворки полностью доступны, поднялась на 2-е место в OpenClaw Top2

robot
Генерация тезисов в процессе

Китайская компания по разработке крупных моделей Starry Sky Leap после открытия модели Step 3.5 Flash выпустила также предварительные веса базовой модели Agent (Base), средние веса обучения (Midtrain) и сопутствующую обучающую платформу Steptron. Известно, что Step 3.5 Flash использует разреженную архитектуру MoE с общим количеством параметров 196 миллиардов, при этом во время вывода активируется около 110 миллиардов параметров, а скорость обработки запросов достигает до 350 TPS при выполнении одной задачи. Эта модель специально разработана для сценариев с агентами (Agent), показывает отличные результаты в сложных задачах с глубоким выводом и длинными цепочками, и официально заявлено, что её глубина вывода может конкурировать с некоторыми ведущими закрытыми моделями. На сегодняшний день эта модель была скачана более 300 тысяч раз на платформе Hugging Face и заняла первое место в рейтинге OpenRouter Trending. Также на известном проекте с открытым исходным кодом OpenClaw (китайские пользователи называют его «Маленький лобстер») эта модель поднялась до второго места по популярности. (Дневник Science and Technology Innovation Board)

Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Закрепить