Star Step entièrement open source étape 3.5 Flash : pré-entraînement + cadre d'entraînement entièrement publié, atteint la 2e place d'OpenClaw

robot
Création du résumé en cours

La startup chinoise de grands modèles d’intelligence artificielle, Zejue Xingchen, a publié en open source, après le modèle Step 3.5 Flash, les poids pré-entraînés de ce modèle de base Agent (Base), les poids intermédiaires (Midtrain) ainsi que le cadre d’entraînement Steptron. Selon les informations, le modèle Step 3.5 Flash utilise une architecture MoE sparse, avec un total de 196 milliards de paramètres, mais lors de l’inférence, seulement environ 110 milliards de paramètres sont activés. La vitesse d’inférence peut atteindre jusqu’à 350 TPS pour une seule requête de code. Conçu spécifiquement pour les scénarios d’agents (Agent), il excelle dans les tâches de raisonnement complexe et de longues chaînes, et ses capacités d’inférence sont comparables à celles de certains modèles propriétaires de haut niveau. À ce jour, ce modèle a été téléchargé plus de 300 000 fois sur Hugging Face et est en première place des tendances sur OpenRouter. Sur le projet open source renommé OpenClaw (appelé “Petite Crevette” par les internautes chinois), il s’est classé parmi les deux premiers. (Daily Science and Technology Board Report)

Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
Aucun commentaire
  • Épingler