Estrela em Ascensão abre totalmente o código-fonte do Step 3.5 Flash: pré-treinamento e estrutura de treino totalmente liberados, alcançando o Top 2 no OpenClaw

robot
Geração de resumo em curso

Empresa chinesa de modelos de grande escala dá mais um passo na inovação: após lançar o modelo Step 3.5 Flash de código aberto, também disponibilizou os pesos pré-treinados do modelo base (Base), pesos de treinamento intermediário (Midtrain) e a estrutura de treinamento Steptron. Segundo informações, o Step 3.5 Flash utiliza uma arquitetura esparsa MoE, com um total de 196 bilhões de parâmetros, mas durante a inferência ativa aproximadamente 11 bilhões de parâmetros, atingindo uma velocidade de até 350 TPS por solicitação de código. Este modelo foi projetado especificamente para cenários de agentes inteligentes, apresentando excelente desempenho em tarefas de raciocínio complexo e cadeias longas, com a capacidade de inferência comparável a alguns modelos de elite de código fechado. Até agora, o modelo foi baixado mais de 300 mil vezes na Hugging Face e lidera as tendências no OpenRouter. Além disso, no popular projeto de código aberto OpenClaw (apelidado de “Lagosta” pelos internautas chineses), o modelo ocupa a segunda posição no ranking. (Jornal da Banca de Inovação e Tecnologia)

Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixar