218B modelo experto disperso de código abierto, el tamaño de los parámetros está aquí, el espacio para ajuste fino en tareas downstream es lo suficientemente grande.

Ver original
BlockBeatNews
Cohere de código abierto Command A+:modelo MoE de 218 mil millones de parámetros, enfocado en agentes empresariales y soberanía de datos
Cohere lanza oficialmente el modelo de expertos mixtos dispersos de 218B parámetros Command A+, dirigido a implementaciones privadas empresariales y soberanía de datos, evitando el bloqueo por parte del proveedor. La inferencia activa 25B, requiere dos H100 o una B200, y también ofrece opciones de cuantificación de baja precisión. Entrada multimodal nativa, 128K de contexto, 64K de salida, cubre 48 idiomas, adecuado para razonamiento complejo, llamadas a herramientas y procesamiento de documentos largos.
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Fijado