Поступовий зірковий світ повністю відкривається. Step 3.5 Flash: повний реліз попереднього навчання та навчальної платформи. Вийшов на друге місце в OpenClaw.

robot
Генерація анотацій у процесі

Китайська компанія-стартап у сфері великих моделей, Z阶跃星辰, після відкриття коду Step 3.5 Flash моделі, також відкрила попередньо натреновані ваги базової моделі Agent (Base), середньої тренувальної ваги (Midtrain) та відповідний тренувальний фреймворк Steptron. За інформацією, Step 3.5 Flash використовує розріджену архітектуру MoE з загальною кількістю параметрів 1960 мільярдів, але під час обробки запитів активує лише близько 110 мільярдів параметрів, а швидкість обробки для однієї задачі коду досягає 350 TPS. Ця модель спеціально розроблена для сценаріїв агентів (Agent), демонструючи відмінні результати у складних задачах з довгими ланцюгами та складною логікою, офіційно заявляється, що її глибина обробки може конкурувати з деякими провідними закритими моделями. На даний момент ця модель вже завантажена понад 300 тисяч разів на Hugging Face і посідає перше місце у трендах OpenRouter. Також, на популярному відкритому проекті OpenClaw (який китайські користувачі називають “Маленький лобстер”), ця модель піднялася до другого місця за популярністю. (Китайська газета “科创板日报”)

Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріпити