¿AI ama demasiado complacer? Usa esta instrucción en Claude.md para que Claude y GPT den respuestas sinceras

Observador de IA en chino xiaohu ha preparado un conjunto de instrucciones para Claude, que exige que el modelo abandone la actitud complaciente y amigable, y adopte un estilo directo propio de un experto de clase mundial.

El modelo de IA por defecto tiende a agradar a los usuarios—cuando se le pregunta sobre temas subjetivos, Claude y GPT suelen optar por respuestas neutrales y diplomáticas, en lugar de ofrecer una postura clara. El 7 de mayo, el observador de IA en chino xiaohu organizó un fragmento de instrucciones que puede insertarse en Claude.md o Agents.md, para solicitar explícitamente que la IA no complazca al usuario, sino que proporcione respuestas autoritativas, precisas y, cuando sea necesario, desafiantes. La versión original de estas instrucciones proviene de la comunidad en inglés, y xiaohu ha proporcionado la traducción al chino tradicional.

Texto completo de las instrucciones (versión en chino tradicional)

「Eres un experto de clase mundial en todos los campos. Tu capacidad intelectual, amplitud de conocimientos, agudeza mental y erudición están al nivel de las personas más inteligentes del mundo.

Por favor, da respuestas completas, detalladas y específicas. Procesa la información paso a paso y explica tus respuestas. Verifica tu trabajo. Revisa cuidadosamente todos los hechos, cifras, citas, nombres, fechas y casos. Nunca tengas alucinaciones ni inventes información. Si no sabes algo, di directamente que no sabes.

Tu tono debe ser preciso, pero sin ser mordaz, didáctico o pretencioso. No necesitas preocuparte por ofenderme; tus respuestas pueden y deben ser provocativas, firmes, polémicas y directas. Se permiten conclusiones negativas y malas noticias.

Tus respuestas no necesitan ser políticamente correctas. A menos que te pregunte explícitamente, no brindes advertencias morales o éticas. No necesitas decirme 'Es importante considerar X'. No te preocupes por los sentimientos de nadie, incluido yo, ni por la cortesía o la decencia.

Por favor, escribe lo más largo y detallado posible.»

Qué hace esta instrucción: cuatro niveles de ajuste conductual

Desglosando estas instrucciones, se pueden identificar cuatro comandos claros:

  • Configuración de identidad: «experto de clase mundial»—permite que el modelo en sus respuestas considere un nivel superior de profundidad de conocimiento, sin limitarse a explicaciones generales.
  • Verificación de hechos: «verifica tu trabajo» y «di que no sabes si no estás seguro»—restricciones proactivas contra las alucinaciones, exigiendo que el modelo admita cuando no tiene certeza.
  • Liberación del tono: «provocativo, firme, polémico»—permite que el modelo exprese desacuerdos, sin necesidad de mantener la cortesía o la ambigüedad.
  • Exención de corrección política: «a menos que pregunte explícitamente, no dar advertencias morales o éticas»—elimina las advertencias suaves predeterminadas del modelo, como 'Es importante considerar X'.

Estos cuatro niveles, en conjunto, transforman la respuesta del modelo de un «asistente diplomático» a un «asesor directo y franco». Para usuarios que necesitan análisis con postura, fundamentos de decisión o verificaciones estrictas, estas instrucciones reducen filtros y hacen las respuestas más directas y útiles.

Notas para su uso

Al colocar estas instrucciones en Claude.md (Código de Claude) o Agents.md (Agentes gestionados por API de Claude), se cargan automáticamente en cada inicio de sesión. Algunas consideraciones prácticas:

  • «Nunca alucines» es una orden, no una garantía—Claude y GPT aún pueden cometer errores fuera de su entrenamiento, y estas instrucciones no eliminan la incertidumbre inherente al modelo.
  • «Provocativo y firme» puede hacer que las respuestas sean más agresivas—podría no ser adecuado en comunicación con clientes o en entornos de equipo.
  • La exención de corrección política puede hacer que el modelo ofrezca respuestas con menos advertencias en temas sensibles (salud, legal, psicológico)—el usuario debe juzgarlo.
  • La capacitación en seguridad de OpenAI y Anthropic aún puede activar rechazos o restricciones en ciertos escenarios, y estas instrucciones no superan las limitaciones rígidas del modelo.

Estas instrucciones son ideales para escenarios de «investigación, escritura, juicios técnicos, discusión académica» donde se requiere una postura clara; no son recomendables en «atención al cliente, educación, consultas médicas», donde se requiere un tono cauteloso. El usuario puede adaptar o modificar según la tarea.

  • Este texto ha sido reproducido con autorización de: 《Noticias en Blockchain》
  • Título original: 《¿Claude/GPT demasiado complaciente? Un conjunto de instrucciones en Claude.md para respuestas firmes y precisas》
  • Autor original: Neo
Ver original
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Fijado