Socio de YC: En lugar de competir en tamaño de modelos, mejor dejar que la IA evolucione por sí misma escribiendo código como un científico

robot
Generación de resúmenes en curso
Según la monitorización de Beating, la socia de Y Combinator Diana Hu señaló en X que, en comparación con simplemente ampliar la escala de parámetros, el futuro está en construir una capa delgada de software sobre el modelo base, permitiendo que la IA como programador escriba sus propias reglas para resolver problemas (modelos del mundo ejecutables). La IA puede probar, modificar y simplificar el código continuamente según los resultados, sin necesidad de realizar costosos ajustes finos en el modelo grande en sí.

El camino del aprendizaje de código sin gradiente confirma el paradigma de aprendizaje heurístico (Heuristic Learning) propuesto el mes pasado por el miembro clave de entrenamiento posterior de OpenAI,翁家翌. Para que la IA aprenda una tarea, el aprendizaje reforzado tradicional requiere miles de pruebas, forzando la experiencia en la caja negra de la red neuronal, lo cual consume mucha energía y es propenso a olvidar. Sin embargo, los experimentos de翁家翌 demostraron que, sin ajustar ningún parámetro del modelo grande, la IA puede escribir código Python, buscar errores y ajustar reglas por sí misma, logrando completar el juego de Atari Breakout. Esto indica que el portador del conocimiento puede ser un sistema de código legible y testeable por humanos, en lugar de pesos de redes neuronales incomprensibles.

Según Paul Graham, cofundador de YC, el ciclo de escribir código, verificar y comprimir es muy similar a la investigación diaria de los científicos. Los modelos grandes no necesitan reconstruir el cerebro, sino que, como los científicos, usan código para formular hipótesis en nuevos entornos, ejecutan el código para realizar experimentos de verificación y extraen las reglas más simples para resolver problemas. El proceso de buscar el programa más simple también es la medida definitiva de la eficiencia de la inteligencia artificial en ARC-AGI.

La ventaja clave es que el aprendizaje sin gradiente puede aprovechar directamente la mejora de la capacidad del modelo base. Cuanto más inteligente se vuelva el modelo base, más fuertes serán los códigos y estrategias que la IA genere. Basándose en la dolorosa lección de Richard Sutton (The Bitter Lesson), el aprendizaje de código sin gradiente está trazando una nueva curva en forma de S. Con la explosión en la capacidad de código de los modelos grandes, la vía de autoevolución de la IA está abriendo el telón de la próxima generación de paradigmas de inteligencia artificial.
Ver original
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Fijado