Prime Intellect plataforma abierta de Lab: El entrenamiento posterior del Agente se realiza en un ciclo cerrado, la facturación se realiza por token y no por duración de GPU

robot
Generación de resúmenes en curso

Noticia de CoinWorld, Prime Intellect anuncia que su plataforma de entrenamiento posterior a su Agente, Lab, ha pasado de la fase beta a la versión oficial.
La plataforma integra evaluación, entrenamiento de aprendizaje por refuerzo (RL), despliegue de adaptadores y razonamiento en un ciclo cerrado, permitiendo a los usuarios definir tareas y criterios de puntuación, y la plataforma automatiza el proceso de prueba y error repetido en las tareas, recopilando señales de recompensa y entrenando adaptadores Lora.
El entrenamiento se factura por token en lugar de por duración de GPU, basado en el marco de código abierto Prime-RL de la compañía.
La primera versión de Lab soporta 14 modelos de Nvidia, OpenAI, Meta y Qwen, con parámetros desde 1B hasta 70B, cubriendo arquitecturas densas y MOE.
Prime Intellect fue fundada en 2023, con una financiación acumulada superior a 70 millones de dólares, con una ronda A liderada por Founders Fund y una ronda B liderada por Radical Ventures.

Ver original
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Anclado