Tether ra mắt AI y tế trên thiết bị, vượt xa các mô hình của Google trong các bài kiểm tra chuẩn

Nhóm Nghiên cứu AI của Tether đã phát hành QVAC MedPsy-1.7B và MedPsy-4B, các mô hình ngôn ngữ y tế chuyên biệt chỉ dành cho văn bản được xây dựng để chạy trực tiếp trên các thiết bị tiết kiệm năng lượng như điện thoại thông minh và thiết bị đeo.

Theo nhóm, các mô hình này vượt trội hơn một số hệ thống AI y tế lớn, bao gồm của Google, trên nhiều tiêu chuẩn đánh giá khác nhau, và hoạt động tương đương với các hệ thống lớn hơn nhiều trong các nhiệm vụ lý luận y tế và kiến thức trong khi duy trì thực thi hoàn toàn tại chỗ và quyền riêng tư.

Các hệ thống AI truyền thống trong chăm sóc sức khỏe dựa vào các mô hình lớn được lưu trữ trên đám mây, yêu cầu dữ liệu nhạy cảm như hồ sơ bệnh nhân và đầu vào chẩn đoán phải truyền đến các máy chủ bên ngoài, tạo ra rủi ro về quyền riêng tư và tuân thủ quy định. Kiến trúc này ngày càng chịu áp lực khi ngành AI y tế dự kiến sẽ tăng từ khoảng 36 tỷ đô la hiện nay lên hơn 500 tỷ đô la vào năm 2033.

Nhóm của Tether cho biết QVAC MedPsy thách thức mô hình mở rộng bằng cách tập trung vào hiệu quả.

Mô hình 1.7B phù hợp với điện thoại thông minh. Phiên bản nhỏ này đạt điểm 62,62 trên bảy tiêu chuẩn đánh giá y tế tiêu chuẩn, vượt qua MedGemma-1.5-4B-it của Google hơn 11 điểm mặc dù nhỏ hơn một nửa kích thước của nó, theo các nhà nghiên cứu. Nó cũng vượt qua MedGemma 27B trong các nhiệm vụ lâm sàng thực tế như HealthBench Hard.

Phiên bản 4B đạt 70,54 trên cùng các bài kiểm tra, vượt qua MedGemma-27B, một mô hình lớn gần bảy lần. Nó thể hiện hiệu suất mạnh mẽ trên HealthBench, HealthBench Hard và MedXpertQA.

Các kết quả này bao gồm tám bộ tiêu chuẩn đánh giá, bao gồm MedQA, MedMCQA, MMLU Health, PubMedQA, AfriMedQA, MedXpertQA và HealthBench, được hỗ trợ bởi đào tạo y tế theo giai đoạn kết hợp giám sát, dữ liệu lý luận lâm sàng được chọn lọc và học tăng cường.

“Với QVAC MedPsy, chúng tôi tập trung vào việc cải thiện hiệu quả ở cấp độ mô hình, thay vì mở rộng kích thước,” Giám đốc điều hành của Tether, Paolo Ardoino, bình luận về việc phát hành.

Các mô hình này không chỉ thông minh mà còn rất thực tế, như các nhà nghiên cứu nhận xét. Chúng phản hồi nhanh chóng với các câu trả lời ngắn gọn nhưng vẫn đầy đủ, tiết kiệm thời gian và pin. Chúng có sẵn dưới dạng nén dễ sử dụng phù hợp với các thiết bị di động mà không làm giảm chất lượng đáng kể.

Về mặt kỹ thuật, mô hình 4B tạo phản hồi trong khoảng 909 tokens, so với khoảng 2.953 của các hệ thống tương đương, giảm 3,2 lần. Mô hình 1.7B trung bình khoảng 1.110 tokens so với 1.901, giảm đầu ra 1,7 lần.

Cả hai mô hình đều được phát hành dưới định dạng GGUF đã lượng tử hóa, với các phiên bản nén có trọng lượng khoảng 1,2 GB và 2,6 GB tương ứng.

“Sự kết hợp đó quan trọng vì nó trực tiếp giảm yêu cầu tính toán, độ trễ và chi phí. Nó cho phép mô hình chạy tại chỗ trên phần cứng tiêu chuẩn thay vì dựa vào hạ tầng từ xa,” Ardoino bổ sung. “Trong chăm sóc sức khỏe, điều đó thay đổi hoàn toàn các giới hạn; bạn có thể thực hiện lý luận y tế nơi dữ liệu đã tồn tại, trong hệ thống bệnh viện hoặc trên thiết bị, mà không cần chuyển dữ liệu nhạy cảm qua đám mây hoặc chờ xử lý bên ngoài.”

Các mô hình hiện đã có sẵn miễn phí theo giấy phép mở trên Hugging Face.

                    **Tiết lộ:** Bài viết này do Vivian Nguyen chỉnh sửa. Để biết thêm thông tin về cách chúng tôi tạo và xem xét nội dung, vui lòng xem Chính sách biên tập của chúng tôi.
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Ghim