Tether meluncurkan AI medis di perangkat yang mengungguli model Google dalam pengujian tolok ukur

Kelompok Riset AI Tether telah merilis QVAC MedPsy-1.7B dan MedPsy-4B, model bahasa medis khusus teks yang dibangun untuk berjalan langsung di perangkat berdaya rendah seperti ponsel pintar dan perangkat wearable.

Menurut tim, model ini mengungguli beberapa sistem AI medis besar, termasuk milik Google, pada berbagai tolok ukur, dan tampil sebanding dengan sistem yang jauh lebih besar dalam tugas penalaran dan pengetahuan medis sambil mempertahankan eksekusi lokal penuh dan privasi.

Sistem AI tradisional di bidang kesehatan bergantung pada model yang dihosting di cloud besar, yang memerlukan data sensitif seperti catatan pasien dan input diagnostik untuk dikirim ke server eksternal, menciptakan risiko privasi dan kepatuhan. Arsitektur ini semakin mendapat tekanan karena sektor AI kesehatan diproyeksikan tumbuh dari sekitar $36 miliar saat ini menjadi lebih dari $500 miliar pada tahun 2033.

Tim Tether mengatakan bahwa QVAC MedPsy menantang paradigma skala dengan fokus pada efisiensi.

Model 1,7B ini ramah ponsel. Versi kecil ini mendapatkan skor 62,62 di tujuh tolok ukur medis standar, mengalahkan MedGemma-1.5-4B-it dari Google lebih dari 11 poin meskipun ukurannya kurang dari setengahnya, menurut para peneliti. Model ini juga mengungguli MedGemma 27B dalam tugas klinis dunia nyata seperti HealthBench Hard.

Versi 4B mencapai skor 70,54 pada pengujian yang sama, melampaui MedGemma-27B, sebuah model yang hampir tujuh kali lebih besar. Model ini menunjukkan performa yang kuat di HealthBench, HealthBench Hard, dan MedXpertQA.

Hasil ini mencakup delapan set tolok ukur termasuk MedQA, MedMCQA, MMLU Health, PubMedQA, AfriMedQA, MedXpertQA, dan HealthBench, yang didukung oleh pelatihan medis bertahap yang menggabungkan supervisi, data penalaran klinis yang dikurasi, dan pembelajaran penguatan.

“Dengan QVAC MedPsy, fokus kami adalah meningkatkan efisiensi di tingkat model, bukan memperbesar ukurannya,” kata CEO Tether, Paolo Ardoino, tentang peluncuran ini.

Model-model ini tidak hanya cerdas tetapi juga sangat praktis, seperti yang dicatat oleh para peneliti. Mereka merespons dengan cepat dengan jawaban singkat tetapi tetap lengkap, menghemat waktu dan daya baterai. Mereka tersedia dalam format terkompresi yang mudah digunakan dan cocok untuk perangkat mobile tanpa kehilangan banyak kualitas.

Secara teknis, model 4B menghasilkan respons dalam sekitar 909 token, dibandingkan sekitar 2.953 untuk sistem sebanding, mengurangi output sebesar 3,2 kali. Model 1,7B rata-rata sekitar 1.110 token versus 1.901, mengurangi output sebesar 1,7 kali.

Kedua model dirilis dalam format GGUF yang dikuantisasi, dengan versi terkompresi berbobot sekitar 1,2 GB dan 2,6 GB masing-masing.

“Kombinasi ini penting karena secara langsung mengurangi kebutuhan komputasi, latensi, dan biaya. Ini memungkinkan model berjalan secara lokal di perangkat keras standar alih-alih bergantung pada infrastruktur jarak jauh,” tambah Ardoino. “Dalam bidang kesehatan, ini mengubah seluruh batasan; Anda dapat menjalankan penalaran medis di mana data sudah ada, di dalam sistem rumah sakit atau di perangkat, tanpa memindahkan informasi sensitif melalui cloud atau menunggu proses eksternal.”

Model-model ini sekarang tersedia secara gratis di bawah lisensi terbuka di Hugging Face.

                    **Pengungkapan:** Artikel ini diedit oleh Vivian Nguyen. Untuk informasi lebih lanjut tentang bagaimana kami membuat dan meninjau konten, lihat Kebijakan Editorial kami.
Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Sematkan