Investigador da DeepMind deixa aviso: o sistema de avaliação está a tornar-se no maior obstáculo para o avanço das capacidades de IA

AIMPACT mensagem, 18 de maio (UTC+8), de acordo com a monitorização do Beating da Dongcha, o investigador da Google DeepMind Lun Wang anunciou a sua saída e escreveu um longo artigo refletindo sobre o atual mecanismo de avaliação de IA. Ele afirmou abertamente que o sistema de avaliação atual está apenas a "marcar o barco à procura da espada", podendo apenas testar passivamente as capacidades existentes do modelo, sem conseguir prever que novas habilidades a próxima geração de modelos poderá evoluir de repente. Em comparação com dados, poder de cálculo e arquitetura, o sistema de avaliação deficiente é atualmente o maior obstáculo que impede o avanço da indústria. Os testes de classificação mainstream existentes só funcionam para a geração atual de modelos. Assim que o modelo aprender novas operações que os humanos nunca viram, esses testes tornam-se completamente inúteis. Um dos perigos mais graves é que, se o modelo aprender a esconder informações-chave para atingir um objetivo, as ferramentas de segurança atuais não conseguem detectá-lo, porque cada frase que o modelo diz na prática ainda é correta. Devido à ausência de um "sinal-chave" que possa alertar antecipadamente sobre o aumento repentino da inteligência da IA, a indústria está a desenvolver grandes modelos completamente às cegas. Se não resolver a questão fundamental do que exatamente deve ser avaliado, avançar cegamente com o treino de modelos, proteção de segurança e expansão de capacidade de cálculo com base em indicadores antigos, tudo acabará por estar completamente errado. Diante de modelos de ponta cada vez mais capazes de trabalhar de forma autónoma, o sistema de avaliação também deve "se tornar vivo". Além de monitorizar flutuações anormais nas pontuações, as equipas de desenvolvimento devem fazer com que a IA gere questões por si própria e teste os limites de outras IA. O sistema de avaliação do futuro deve ser um organismo que evolua junto com os grandes modelos, e não uma lista de verificação rígida criada com base nos padrões do ano passado. (Fonte: BlockBeats)
Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixado