El equipo de Berkeley anuncia que ha superado 8 de los principales benchmarks de evaluación de agentes inteligentes y ha abierto el código fuente

ME News Noticias, 19 de abril (UTC+8), el grupo de investigación en inteligencia artificial de Berkeley (berkeley_ai) citó la declaración de Dawn Song, anunciando que su equipo logró superar 8 de los principales estándares de evaluación de agentes inteligentes. El equipo decidió liberar el código de las herramientas utilizadas para lograr este resultado y las llamó BenchJack. La herramienta se describe como "una prueba de penetración para evaluaciones", diseñada para ayudar a otros desarrolladores a probar activamente y descubrir posibles vulnerabilidades en sus propios sistemas de evaluación. (Fuente: InFoQ)
Ver original
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • 9
  • 1
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
DrinkWaterBeforeTheMarket
· hace7h
Herramientas de código abierto + metodologías abiertas, así es como debería ser el mundo académico
Ver originalResponder0
ElevatorMeme
· hace10h
Estoy curioso de cómo fue exactamente atacado, esperaré el artículo.
Ver originalResponder0
FrontrunFail
· hace11h
8 principales referencias principales completamente destruidas, el mundo de las evaluaciones va a temblar
Ver originalResponder0
AutumnSlopeCabin
· hace11h
En cuanto a las pruebas de penetración de evaluación, este concepto es bastante novedoso.
Ver originalResponder0
OutsiderOfZhiyuandao
· hace11h
El equipo de Dawn Song actúa, y yo reconozco el valor que esto implica
Ver originalResponder0
ChaintraceAuntie
· hace11h
El "Espejo de la Verificación de Agentes" ha llegado
Ver originalResponder0
SnackFi
· hace11h
Buscar activamente las debilidades es mejor que recibir golpes pasivamente, apoya este espíritu de código abierto
Ver originalResponder0
ColdWalletFitnessCoach
· hace11h
A partir de ahora, al consultar la tabla de clasificación, primero debes preguntar: ¿Has protegido contra BenchJack?
Ver originalResponder0
HedgeHedgeBaby
· hace11h
BenchJack, ese nombre tiene algo, benchmark + hijack, ¿verdad?
Ver originalResponder0
Ver más
  • Fijado