OpenClaw v2026.4.23 Actualización: gpt-image-2 Ahora Disponible Sin Clave API, Nuevo Modo de 'Contexto Bifurcado' para Sub-Agentes

Según la monitorización de Dongcha Beating, el marco de agentes de IA de código abierto OpenClaw ha lanzado la versión v2026.4.23, con cambios principales centrados en la generación de imágenes, mecanismos de sub-agentes y mejoras de seguridad. En términos de generación de imágenes, gpt-image-2 de OpenAI ahora puede ser llamado directamente a través de Codex OAuth, eliminando la necesidad de una configuración separada de OPENAI_API_KEY. También se ha integrado el modelo de imágenes de OpenRouter, permitiendo su uso mediante la herramienta image_generate. La edición de imágenes con múltiples referencias ha cambiado de URL de datos JSON a carga multipart, resolviendo problemas previos con fallos en ediciones complejas. Los agentes ahora pueden especificar parámetros como calidad de imagen, formato de salida y transparencia de fondo según sea necesario. El sub-agente ha introducido un modo de ‘contexto bifurcado’: cuando un agente principal deriva un sub-agente, puede optar por que el sub-agente herede el contexto de la conversación actual en lugar de comenzar desde una sesión en blanco cada vez. El modo predeterminado sigue siendo el modo de aislamiento, que puede activarse según sea necesario. Además, las herramientas de generación de imágenes, videos, música y TTS ahora soportan configuraciones de tiempo de espera a nivel de llamada individual, ya no sujetas a restricciones de tiempo de espera globales. Las mejoras de seguridad son las más extensas en esta versión. Las correcciones incluyen: el puente de herramientas MCP ya no expone herramientas privilegiadas como cron a llamadas de no propietarios; en Android, los intents externos están prohibidos de enviar automáticamente prompts inyectados, permitiendo solo borradores prellenados; la edición de la configuración de tiempo de ejecución del gateway ha cambiado de una lista negra a una lista blanca, permitiendo modificaciones solo en campos específicos como prompts y modelos; el texto libre en las tarjetas de contacto de WhatsApp y la información de ubicación ya no se concatena directamente en el cuerpo del mensaje, sino que se renderiza usando JSON aislado para prevenir inyección de prompts; los canales de Teams requieren que el token del Bot Framework lleve el appid correcto, bloqueando la reproducción de tokens entre bots. En cuanto al sistema de memoria, la tarea de soñar (una organización automática periódica de memorias) ha sido separada del latido; anteriormente, desactivar el latido también desactivaba el soñar, pero ahora no afectan entre sí. La ventana de contexto de incrustación local ha añadido una opción de configuración memorySearch.local.contextSize, que por defecto es 4096, facilitando ajustes en dispositivos de baja especificación.

Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Anclado