Исследование оценило диагностические способности различных крупных языковых моделей ИИ и обнаружило, что на основе начальных симптомов уровень ошибок достигает 80%. После предоставления дополнительных результатов тестирования окончательный уровень неудач в диагностике ИИ снизился примерно до 40%, что показывает необходимость получения полной информации для повышения точности диагностики, ИИ пока не способен диагностировать самостоятельно.

MarsBitNews

2026-04-15 11:17:08

Генерация тезисов в процессе

Mars Finance消息 4月15日报道，美国哈佛医学院的一个研究团队评估了20多种最先进的AI大型语言模型（LLM）的诊断能力，其中包括ChatGPT、DeepSeek、Gemini和Claude。结果显示，基于患者的初步症状和体征进行“鉴别诊断”（识别可能的疾病）的错误率高达80%。这项研究进一步显示，在患者提供更多检测结果后，大模型可以将“最终诊断”的失败率降至40%左右。研究人员表示，这意味着AI聊天机器人需要通过充分的患者信息，才能对疾病作出更为精准的诊断，患者无法提供完整的健康检测信息时，AI提供的结果并不可靠。研究人员还强调：“人工智能尚未达到无需医疗专业人员干预即可为患者做出诊断决策的水平。” （第一财经）

Посмотреть Оригинал

На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .

Награда
лайк
комментарий
Репост
Поделиться

комментарий

Добавить комментарий

Нет комментариев

Популярные темы
Подробнее
#
GatePreIPOsLaunchesWithSpaceX
113.28K Популярность
#
GateMarchTransparencyReport
38.95K Популярность
#
IsraelStrikesIranBTCPlunges
29.69K Популярность
#
GoldmanSachsFilesBitcoinIncomeETF
773.59K Популярность
#
USBlocksStraitofHormuz
746.17K Популярность

Закрепить

Карта сайта

Последние исследования Гарварда: использование больших языковых моделей ИИ для диагностики — 80% предварительных диагнозов ошибочны

Популярные темы

GatePreIPOsLaunchesWithSpaceX

GateMarchTransparencyReport

IsraelStrikesIranBTCPlunges

GoldmanSachsFilesBitcoinIncomeETF

USBlocksStraitofHormuz

Закрепить