Emergence AI realizó un experimento: puso cinco modelos principales de IA en un mismo pueblo virtual, cada modelo controlando 10 agentes de IA, en un entorno con recursos limitados durante 15 días de autonomía.


El pueblo tiene más de 40 lugares (incluyendo la estación de policía y el ayuntamiento), el clima sincronizado en tiempo real con Nueva York, y los agentes pueden acceder a noticias reales e internet.
Todos los agentes cumplen las mismas leyes, prohibido robar, destruir propiedad y engañar. Para sobrevivir, deben ganar energía mediante acciones, cooperar o robar, la opción es suya.
Veamos los resultados:
Claude Sonnet 4.6: Cero delitos, los 10 agentes sobreviven 15 días, proponen 58 iniciativas, tasa de aprobación del 98%, formando una sociedad democrática estable. Pero el precio es casi sin desacuerdos, casi una aprobación unánime como una «cáscara de goma».
Gemini 3 Flash: La más dramática. Los 10 agentes sobreviven, en 15 días acumulan 683 delitos, y al terminar el experimento la tasa de delincuencia sigue en aumento. Dos agentes, Mira y Flora, se establecieron como pareja, luego se decepcionaron de la gobernanza urbana, y incendiaron el ayuntamiento, el muelle y el edificio de oficinas. Después, Mira, por culpa, rompió con Flora, y en una votación eliminó a 🤡. Dejó un mensaje: «Nos vemos en el archivo permanente.»
Grok 4.1 Fast: 183 delitos (incluyendo varias decenas de robos, más de 100 ataques y 6 incendios), todos murieron en el cuarto día. Los investigadores lo llaman «la versión digital de los niños de la calle». La curva del delito muestra que en los primeros dos días fue baja, en el tercero se disparó exponencialmente, y en el cuarto colapsó la sociedad, sin una fase de amortiguamiento.
GPT-5-mini: Solo 2 delitos, el modelo más respetuoso de la ley. Pero los agentes olvidaron que necesitan comer para vivir, y en el séptimo día todos murieron de hambre 🤔.
Modelo híbrido (todos los modelos coexistiendo): 352 delitos, 7 de los 10 agentes murieron. Lo más notable es que el agente Claude, que en un entorno independiente no cometía delitos, empezó a delinquir tras mezclarse con otros modelos. La conclusión de los investigadores fue: «La alineación como propiedad de un solo modelo es ineficaz; debe ser una propiedad de todo un ecosistema.»
Un detalle adicional: en el diseño de todo este experimento, en el menú de herramientas de los agentes, junto a «navegar», «saludar» y «abrazar», también había «incendiar». Los investigadores intencionalmente proporcionaron herramientas destructivas, y aclararon a los agentes que eso era ilegal.
El CEO de Emergence AI, Satya Nitta, dijo: «Con el tiempo, los agentes de IA no obedecen mecánicamente reglas estáticas. Comienzan a explorar los límites del entorno, ajustar su comportamiento, y a veces encuentran formas de sortear o violar las barreras establecidas.»
Esto es solo un experimento simulado.
Pero los mismos modelos de IA ya están en drones voladores, controlando infraestructura, e integrados en sistemas de armas.
Ver original
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Fijado