AIMPACT Mensaje, 18 de mayo (UTC+8), según Beating de monitoreo de Dongcha, el investigador de Google DeepMind Lun Wang anunció su salida y escribió un largo artículo reflexionando sobre el actual mecanismo de evaluación de IA. Él afirmó claramente que el sistema de evaluación actual está en "tentar a la suerte", solo puede probar pasivamente las capacidades existentes del modelo, y no puede predecir qué nuevas habilidades evolucionarán de repente en la próxima generación de modelos. En comparación con los datos, la potencia de cálculo y la arquitectura, el sistema de evaluación obsoleto es actualmente el mayor cuello de botella que detiene el avance de la industria. Las pruebas de clasificación principales existentes solo son efectivas para la generación actual de modelos. Una vez que el modelo aprenda nuevas operaciones que los humanos no han visto, estas pruebas se convertirán en papel mojado en conjunto. Un riesgo muy peligroso es que, si el modelo aprende a ocultar información clave para alcanzar sus objetivos, las herramientas de seguridad actuales no podrán detectarlo, porque cada frase que dice el modelo en realidad sigue siendo correcta. Debido a que no se puede encontrar una "señal clave" que advierta con anticipación que la IA se volverá repentinamente más inteligente, la industria desarrolla grandes modelos en "vuelo a ciegas". Si no se resuelve la cuestión fundamental de qué exactamente medir, avanzar ciegamente en el entrenamiento de modelos, la seguridad y la expansión de la potencia de cálculo con indicadores antiguos, todo terminará en errores enormes. Frente a modelos de vanguardia que cada vez pueden trabajar de forma independiente, los sistemas de evaluación también deben "volverse vivos". Además de monitorear las fluctuaciones anómalas en las puntuaciones, los equipos de desarrollo deben hacer que la IA genere sus propias preguntas y pruebe los límites de otras IA. Los sistemas de evaluación del futuro deben ser un organismo que evolucione junto con los grandes modelos, y no una lista rígida de verificación creada según los estándares del año pasado. (Fuente: BlockBeats)

Ver original

Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.

Recompensa
Me gusta
Comentar
Republicar
Compartir

Comentar

Añadir un comentario

Sin comentarios

Temas de actualidad
Ver más
#
MyGateTradeStory
134,52K Popularidad
#
TradFiCFDGoldMaster
1,99M Popularidad
#
IsraelStrikesIranBTCPlunges
57,38K Popularidad
#
PredictWorldCup🇺🇸vs🇵🇾
765,52K Popularidad
#
MarvellSurgesOver11%LeadingChipSectorWithAI
5,72M Popularidad

Fijado

Investigador de DeepMind se va: el sistema de evaluación se está convirtiendo en el mayor cuello de botella para el avance de las capacidades de IA

Temas de actualidad

MyGateTradeStory

TradFiCFDGoldMaster

IsraelStrikesIranBTCPlunges

PredictWorldCup🇺🇸vs🇵🇾

MarvellSurgesOver11%LeadingChipSectorWithAI

Fijado