218B modelo de especialista esparso de código aberto, o tamanho dos parâmetros está aqui, o espaço para ajuste fino downstream é grande.

Ver original
BlockBeatNews
Cohere código aberto Command A+:Modelo MoE de 218 bilhões de parâmetros, focado em agentes empresariais e soberania de dados
Cohere oficialmente lançou o modelo de especialistas esparsos de 218 bilhões de parâmetros, Command A+, voltado para implantação privada corporativa e soberania de dados, evitando o bloqueio por fornecedores. A ativação de inferência de 25 bilhões requer duas H100 ou uma B200, além de oferecer opções de quantização de baixa precisão. Entrada multimodal nativa, contexto de 128K, saída de 64K, cobrindo 48 idiomas, adequado para inferência complexa, chamadas de ferramentas e processamento de documentos longos.
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
Comentário
Adicionar um comentário
Adicionar um comentário
Sem comentários
  • Fixado