Penelitian terbaru Harvard: Menggunakan model bahasa besar AI untuk diagnosis, 80% diagnosis awal adalah salah

robot
Pembuatan abstrak sedang berlangsung

Berita dari Mars Finance 15 April—Sebuah tim peneliti dari Harvard Medical School di Amerika Serikat mengevaluasi kemampuan diagnosis dari lebih dari 20 model bahasa besar AI (LLM) terkemuka, termasuk ChatGPT, DeepSeek, Gemini, dan Claude. Hasilnya menunjukkan bahwa tingkat kesalahan dalam melakukan “diagnosis diferensial” (mengidentifikasi kemungkinan penyakit) berdasarkan gejala dan tanda awal pasien mencapai hingga 80%. Penelitian ini lebih lanjut menunjukkan bahwa setelah pasien memberikan lebih banyak hasil pemeriksaan, model besar dapat menurunkan tingkat kegagalan “diagnosis akhir” menjadi sekitar 40%. Para peneliti menyatakan bahwa ini berarti chatbot AI perlu mendapatkan informasi pasien yang cukup agar dapat memberikan diagnosis yang lebih akurat, dan ketika pasien tidak dapat menyediakan data pemeriksaan kesehatan lengkap, hasil yang diberikan AI tidak dapat diandalkan. Para peneliti juga menegaskan, “Kecerdasan buatan belum mencapai tingkat di mana dapat membuat keputusan diagnosis tanpa intervensi profesional medis.” (Yicai)

Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Sematkan