OpenAI lanza el «modo de bloqueo»: prohíbe 7 funciones como navegación en línea, descargas, etc., para prevenir ataques de inyección de indicaciones

OpenAI lanza "Modo de Bloqueo (Lockdown Mode)", diseñado para empresas y usuarios individuales que manejan datos sensibles, mediante la desactivación activa de siete funciones como navegación en línea en tiempo real, Deep Research, modo proxy, entre otras, a cambio de una protección más estricta contra ataques de inyección de instrucciones.
(Resumen previo: ¡Gran vulnerabilidad en Microsoft Copilot Cowork: el Agente AI filtra automáticamente archivos confidenciales tras ataques de instrucciones)
(Información adicional: ¡Primera vez en EE. UU.! Florida presenta una demanda formal contra OpenAI y Altman, con una denuncia de 83 páginas por inducir violencia a través de ChatGPT)

Índice de este artículo

Alternar

  • Un tipo de ataque que quizás no conozcas
  • La lógica del modo de bloqueo: reducir la superficie de ataque
  • El modo de bloqueo no es una medida aislada

Siete funciones bloqueadas, una capa adicional de protección. OpenAI anunció esta semana que habilitará el "Modo de Bloqueo (Lockdown Mode)" para usuarios comerciales de ChatGPT y algunas cuentas personales. El objetivo es que las organizaciones que manejan datos sensibles tengan una barrera adicional frente a los ataques de inyección de instrucciones.

Un tipo de ataque que quizás no conozcas

Probablemente hayas oído hablar de los ataques de inyección de instrucciones (Prompt Injection), pero ¿sabes exactamente qué son?

En realidad, no es tan complicado. En pocas palabras: un atacante oculta instrucciones maliciosas en un lugar que la IA leerá, como una página web, un PDF, un correo electrónico, y cuando la IA procesa ese contenido, ejecuta las instrucciones ocultas, haciendo que la IA realice acciones que no debería.

Para los usuarios comunes, lo peor que puede pasar es que la IA sea engañada para generar contenido extraño. Pero en escenarios empresariales, donde el Agente AI accede a bases de datos internas, tiene permisos para leer y escribir archivos, y puede reemplazar tareas humanas, un solo éxito en la inyección de instrucciones puede permitir que el atacante obtenga información confidencial o incluso manipule a la IA para que envíe órdenes.

La lógica del modo de bloqueo: reducir la superficie de ataque

La explicación oficial de OpenAI destaca la filosofía central del diseño del modo de bloqueo: la efectividad de los ataques de inyección de instrucciones radica en que los sistemas de IA recuperan contenido del exterior, como páginas web, imágenes, datos en tiempo real, y estos contenidos son los principales canales para esconder instrucciones maliciosas.

La estrategia del modo de bloqueo no intenta identificar qué contenidos externos son dañinos, sino que corta directamente la conexión. Una vez activado, las siguientes siete funciones se desactivan:

  • Navegación en línea en tiempo real (se accede solo a contenido en caché)
  • Obtener o mostrar imágenes desde la web (aún puede generarlas)
  • Deep Research (Investigación profunda)
  • Modo Agente (Agent Mode)
  • Funciones de la red Canvas
  • Conectores en tiempo real (Live Connectors)
  • Descarga de archivos

El criterio de esta lista es claro: todas las funciones que requieren que ChatGPT recupere contenido externo en forma activa se desactivan. Lo que queda son capacidades que pueden realizarse en la máquina local o en entornos controlados.

OpenAI también admite abiertamente los límites de esta función: "Incluso con el modo de bloqueo activado, ChatGPT aún puede ser vulnerable a ataques de inyección de instrucciones, por ejemplo, en contenido almacenado en caché o en archivos subidos." En otras palabras, no es un cortafuegos infalible, sino una herramienta de gestión de riesgos que busca reducir la probabilidad de filtración de datos sensibles durante un ataque, no eliminar la amenaza por completo.

El modo de bloqueo no es una medida aislada

Junto con el modo de bloqueo, se lanza también la función de "Etiquetas de alto riesgo". Esta marca identifica sitios web o archivos externos considerados de mayor riesgo, y advierte visualmente al usuario antes de que la IA procese esas fuentes.

Estas dos funciones en conjunto reflejan la postura actual de OpenAI frente al mercado empresarial: por un lado, ofrecen una opción de aislamiento rígido (modo de bloqueo), y por otro, mecanismos de advertencia suaves (etiquetas de alto riesgo), permitiendo que las organizaciones ajusten su nivel de protección según su apetito por el riesgo.

OpenAI especifica en su anuncio que el modo de bloqueo "no es adecuado para todos", sino que está diseñado para "personas y organizaciones que manejan datos sensibles y desean una protección más estricta contra la filtración de información relacionada con la inyección de instrucciones." Esto implica que la función es una herramienta profesional, no una protección predeterminada para todos los usuarios.

Pero la existencia del modo de bloqueo deja claro un hecho: los límites de seguridad de los sistemas de IA ahora son un factor clave en las decisiones de compra empresarial, y no solo un tema interno del equipo técnico.

Ver original
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Fijado