La Casa Blanca escribió un informe alegando una "liberación" de Anthropic's Claude Fable.


La vulnerabilidad: en un código deliberadamente roto, el modelo se negó a "revisar el código en busca de problemas de seguridad" pero cumplió con "arreglar este código."
El experto externo que Anthropic pidió que lo revisara calificó eso como que el modelo funciona como se pretende.
Ver original
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Fijado