Última pesquisa de Harvard: usar modelos de linguagem de IA para diagnóstico, 80% das diagnósticos preliminares estão incorretos

robot
Geração de resumo em curso

Notícias do Mars Finance 15 de abril — Uma equipa de investigação da Harvard Medical School dos Estados Unidos avaliou a capacidade de diagnóstico de mais de 20 dos modelos de linguagem de IA mais avançados (LLM), incluindo ChatGPT, DeepSeek, Gemini e Claude.
Os resultados mostraram que a taxa de erro na realização de “diagnóstico diferencial” (identificação de possíveis doenças) com base nos sintomas e sinais iniciais do paciente atingiu até 80%.
Este estudo também revelou que, após o paciente fornecer mais resultados de testes, os grandes modelos podem reduzir a taxa de falha no “diagnóstico final” para cerca de 40%.
Os investigadores afirmaram que isso significa que os chatbots de IA precisam de informações completas do paciente para fazer diagnósticos mais precisos, e quando os pacientes não podem fornecer informações completas de exames de saúde, os resultados fornecidos pela IA não são confiáveis.
Os investigadores também enfatizaram: “A inteligência artificial ainda não atingiu um nível em que possa tomar decisões de diagnóstico para os pacientes sem intervenção de profissionais de saúde.”
(First Financial)

Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixar