La última opinión de Karpathy sobre Agentes: las grandes empresas no dominan la tecnología central de los agentes, los desarrolladores individuales están dominando la vanguardia.

robot
Generación de resúmenes en curso

La última perspectiva interna de Andrej Karpathy sobre agentes señala directamente el mayor error actual en el campo de la IA: la gente está forzando a los agentes a trabajar, ignorando por completo que primero deben dominar a fondo el modelo subyacente de gran escala. AK dijo una conclusión contraria al sentido común: actualmente, quienes están a la vanguardia de los agentes no son las grandes empresas, sino los desarrolladores independientes y emprendedores. Adjunto el video al final del artículo.

Ya en 2016, OpenAI cayó en este error y pagó un precio de hasta cinco años por ello.

La lógica central que Karpathy quiere transmitir: el primer paso es dejar inmediatamente la fantasía de que los agentes lo hagan todo, y primero entender el modelo subyacente. El segundo paso es reconocer la realidad de la industria: hacer una demostración es extremadamente simple, pero crear un producto requiere diez años. La conducción autónoma ya ha confirmado esto: si se omite la etapa de base, todo lo construido colapsará instantáneamente. El tercer paso es entender que el agente en sí mismo ni siquiera es un producto; el modelo base de gran escala es el verdadero núcleo. Siempre que se establezca bien la base, los agentes surgirán de forma natural.

Recordando su experiencia en OpenAI en 2016, Karpathy, junto con Tim Shi y Jim Fan, participaron en un proyecto llamado World Bits. Su intención original era que los agentes de aprendizaje por refuerzo dejaran de lado pruebas como jugar videojuegos, dejando de jugar a Montezuma's Revenge, y en su lugar intentaran usar una computadora, teclado y ratón.

Esperaban que los agentes pudieran realizar tareas diarias realmente útiles, como reservar vuelos o pedir comida en páginas web extremadamente simples. En ese momento, hicieron que la IA hiciera clic frenéticamente en botones del ratón y el teclado, intentando por casualidad entrar en un mundo inteligente más avanzado. El resultado fue evidente: el proyecto fracasó por completo.

La tecnología de aquel entonces no tenía las condiciones necesarias; el único martillo que tenía el equipo era el aprendizaje por refuerzo. Lo correcto en ese momento habría sido olvidar por completo los agentes de IA y concentrar todos los esfuerzos en construir modelos de lenguaje.

Cinco años después, tras una breve incursión en el campo de la conducción autónoma, Karpathy descubrió que los agentes de IA volvían a ser el tema más candente de la industria, pero toda la cadena de herramientas había cambiado drásticamente. Hoy en día, la forma en que todos resuelven estos problemas está completamente reconstruida; quienes desarrollan agentes probablemente no necesitan usar ninguna técnica de aprendizaje por refuerzo. Esta evolución superó todas las expectativas de aquel entonces.

Ahora todo el mundo está entusiasmado con los agentes, porque es fácil asociar que la inteligencia artificial general eventualmente se manifestará en forma de algún tipo de agente de IA. Es probable que en el futuro surjan grupos de agentes, e incluso grandes organizaciones o civilizaciones de entidades digitales. Suena realmente emocionante.

Ante este entusiasmo, Karpathy elige echar un jarro de agua fría. Hay una gran categoría de problemas donde es fácil usar la imaginación y hacer demostraciones impresionantes, pero extremadamente difícil convertirlos en productos reales.

La conducción autónoma es un ejemplo extremadamente típico. Es muy fácil imaginar un coche dando vueltas por la manzana de forma autónoma y hacer una demostración, pero convertirlo en un producto viable requiere diez años. Lo mismo ocurre en el campo de la realidad virtual. Los agentes también encajan perfectamente en esta característica: es fácil imaginar y hacer demostraciones, pero para que realmente funcionen, los desarrolladores deben estar preparados para trabajar durante diez años.

En busca de nuevas ideas, Karpathy sugiere volver a inspirarse en la neurociencia. A principios del aprendizaje profundo se hizo así, y ahora desarrollar agentes puede tomar prestado nuevamente el modo de operación del cerebro.

Un ente digital completo necesita tener todas las herramientas cognitivas que posee un ser humano. Además del modelo de lenguaje como parte de la solución, se necesita un asistente interno para planificar con antelación y reflexionar sobre las acciones.

La estructura del cerebro proporciona un plano de referencia perfecto. El equivalente del hipocampo en un agente de IA es registrar las huellas de la memoria, utilizando técnicas de incorporación de vectores para indexar y recuperar. Sabemos aproximadamente cómo construir la corteza visual y auditiva de un ente digital. El papel del tálamo también merece reflexión. El tálamo se encarga de integrar toda la información; se podría decir que es la sede de la conciencia. Cuando múltiples entes digitales compiten por el control y el micrófono para decidir el próximo paso, el tálamo se encarga de manejar este conflicto complejo. Karpathy también recomendó especialmente el libro "El cerebro y el comportamiento" de David Eagleman, considerando que la neurociencia contiene una excelente inspiración para diseñar individuos digitales.

Finalmente, Karpathy compartió una realidad industrial altamente disruptiva.

Actualmente, quienes están a la vanguardia de las capacidades de los agentes de IA son, sin duda, los desarrolladores independientes y emprendedores que están construyendo agentes ahora mismo. Laboratorios de modelos de lenguaje a gran escala como OpenAI o DeepMind no están a la vanguardia en el ámbito de los agentes en este momento.

OpenAI es muy bueno entrenando grandes modelos de lenguaje basados en transformadores. Si hoy se publica un artículo que propone un nuevo método de entrenamiento de transformadores, es probable que OpenAI ya lo haya intentado dos años y medio antes, y sepa claramente la razón del éxito o fracaso. Las grandes empresas tienen una barrera técnica absoluta en este campo.

Cuando se publica un artículo sobre un nuevo tipo de agente, la situación es completamente diferente. El equipo de una gran empresa también lo encontrará novedoso, porque no han investigado en secreto sobre esta rama específica durante cinco años. Esto significa que los gigantes en esta pista deben competir con todos los emprendedores de base y hackers.

Para los desarrolladores comunes que ahora están construyendo agentes, ustedes están en la vanguardia de esta tecnología transformadora.

Fuente de este artículo: AI寒武纪

Aviso de riesgo y términos de exención de responsabilidad

        El mercado tiene riesgos, la inversión debe ser cautelosa. Este artículo no constituye un consejo de inversión personal, ni considera los objetivos de inversión, situación financiera o necesidades particulares de usuarios individuales. Los usuarios deben considerar si cualquier opinión, punto de vista o conclusión en este artículo se ajusta a su situación particular. Invertir según esto es bajo su propia responsabilidad.
Ver original
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Fijado