Tether lance une IA médicale intégrée qui dépasse les modèles de Google dans les tests de référence

Le groupe de recherche en IA de Tether a publié QVAC MedPsy-1.7B et MedPsy-4B, des modèles de langage médical spécialisés uniquement en texte, conçus pour fonctionner directement sur des appareils à faible consommation tels que les smartphones et les wearables.

Selon l’équipe, ces modèles surpassent certains grands systèmes d’IA médicale, y compris celui de Google, sur divers benchmarks, et obtiennent des performances comparables à des systèmes beaucoup plus grands sur des tâches de raisonnement médical et de connaissance tout en maintenant une exécution locale complète et la confidentialité.

Les systèmes d’IA traditionnels dans le domaine de la santé reposent sur de grands modèles hébergés dans le cloud, nécessitant la transmission de données sensibles comme les dossiers patients et les entrées de diagnostic vers des serveurs externes, ce qui crée des risques pour la confidentialité et la conformité. Cette architecture est de plus en plus mise à l’épreuve alors que le secteur de l’IA médicale devrait passer d’environ 36 milliards de dollars aujourd’hui à potentiellement plus de 500 milliards de dollars d’ici 2033.

L’équipe de Tether affirme que QVAC MedPsy remet en question le paradigme de la mise à l’échelle en se concentrant sur l’efficacité.

Le modèle de 1,7 milliard de paramètres est compatible avec les smartphones. Cette version minuscule a obtenu un score de 62,62 sur sept benchmarks médicaux standard, dépassant de plus de 11 points le MedGemma-1.5-4B-it de Google, malgré une taille inférieure à la moitié de celle-ci, selon les chercheurs. Il a également surpassé MedGemma 27B dans des tâches cliniques réelles comme HealthBench Hard.

La version de 4 milliards de paramètres a atteint 70,54 sur les mêmes tests, dépassant MedGemma-27B, un modèle presque sept fois plus grand. Elle a montré de bonnes performances sur HealthBench, HealthBench Hard et MedXpertQA.

Ces résultats couvrent huit ensembles de benchmarks, notamment MedQA, MedMCQA, MMLU Health, PubMedQA, AfriMedQA, MedXpertQA et HealthBench, alimentés par une formation médicale progressive combinant supervision, données de raisonnement clinique sélectionnées et apprentissage par renforcement.

« Avec QVAC MedPsy, notre objectif était d’améliorer l’efficacité au niveau du modèle, plutôt que d’augmenter la taille », a commenté le PDG de Tether, Paolo Ardoino, lors de la sortie.

Ces modèles ne sont pas seulement intelligents mais aussi très pratiques, comme le notent les chercheurs. Ils répondent rapidement avec des réponses courtes mais complètes, ce qui permet de gagner du temps et de préserver la batterie. Ils sont disponibles dans des formats compressés faciles à utiliser, qui tiennent confortablement sur des appareils mobiles sans perdre beaucoup de qualité.

Techniquement, le modèle de 4 milliards de paramètres génère des réponses en environ 909 tokens, contre environ 2 953 pour des systèmes comparables, soit une réduction de 3,2 fois. Le modèle de 1,7 milliard de paramètres tourne en moyenne autour de 1 110 tokens contre 1 901, réduisant la sortie d’environ 1,7 fois.

Les deux modèles sont désormais disponibles en format quantifié GGUF, avec des versions compressées pesant respectivement environ 1,2 Go et 2,6 Go.

« Cette combinaison est importante car elle réduit directement les besoins en calcul, la latence et le coût. Elle permet au modèle de fonctionner localement sur du matériel standard au lieu de dépendre d’une infrastructure distante », a ajouté Ardoino. « En santé, cela change complètement les contraintes ; vous pouvez effectuer un raisonnement médical là où se trouvent déjà les données, dans un système hospitalier ou sur un appareil, sans déplacer d’informations sensibles via le cloud ou attendre un traitement externe. »

Les modèles sont désormais disponibles gratuitement sous licence ouverte sur Hugging Face.

                    **Divulgation :** Cet article a été modifié par Vivian Nguyen. Pour plus d’informations sur la façon dont nous créons et révisons le contenu, consultez notre Politique éditoriale.
Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
Aucun commentaire
  • Épingler