Andrej Karpathy publicó llm.c: un pequeño proyecto de un solo archivo, entrenando un modelo del nivel GPT-2 desde cero. Es muy probable que la verdadera IA alfa no sea simplemente seguir el próximo nombre de modelo, sino ejecutar manualmente el ciclo completo del modelo en su forma más mínima. Aquellos que entienden cómo se entrenan paso a paso los pesos, en el futuro tendrán una ventaja en oportunidades de agentes, herramientas y computación, mucho antes que los que solo memorizan las notas de lanzamiento.

Ver original
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Fijado