Tether запускает встроенный медицинский ИИ, который превосходит модели Google в тестах на производительность

Группа исследований ИИ компании Tether выпустила модели QVAC MedPsy-1.7B и MedPsy-4B, специализированные модели медицинского языка только для текста, созданные для работы непосредственно на устройствах с низким энергопотреблением, таких как смартфоны и носимые устройства.

По словам команды, эти модели превосходят некоторые крупные системы медицинского ИИ, включая системы Google, по различным бенчмаркам, и показывают сопоставимые результаты с гораздо большими системами в задачах медицинского рассуждения и знаний, при этом сохраняя полное локальное выполнение и конфиденциальность.

Традиционные системы ИИ в здравоохранении полагаются на крупные облачные модели, требующие передачи чувствительных данных, таких как записи пациентов и диагностические данные, на внешние серверы, что создает риски для конфиденциальности и соблюдения нормативных требований. Эта архитектура все больше подвергается давлению, поскольку сектор медицинского ИИ, по прогнозам, вырастет с примерно 36 миллиардов долларов сегодня до более чем 500 миллиардов долларов к 2033 году.

Команда Tether заявляет, что QVAC MedPsy бросает вызов парадигме масштабирования, сосредотачиваясь на эффективности.

Модель объемом 1,7 миллиарда подходит для смартфонов. Эта крошечная версия набрала 62,62 балла по семи стандартным медицинским бенчмаркам, обогнав MedGemma-1.5-4B-it от Google более чем на 11 пунктов, несмотря на то, что она менее чем вдвое меньше, по словам исследователей. Она также превзошла MedGemma-27B в реальных клинических задачах, таких как HealthBench Hard.

Версия модели объемом 4 миллиарда достигла 70,54 балла по тем же тестам, превзойдя MedGemma-27B, модель почти в семь раз больше. Она показала хорошие результаты на HealthBench, HealthBench Hard и MedXpertQA.

Эти результаты охватывают восемь наборов бенчмарков, включая MedQA, MedMCQA, MMLU Health, PubMedQA, AfriMedQA, MedXpertQA и HealthBench, основанных на поэтапной медицинской подготовке с использованием надзора, курируемых данных клинического рассуждения и обучения с подкреплением.

«С QVAC MedPsy наша цель заключалась в повышении эффективности на уровне модели, а не в увеличении размера», — прокомментировал выпуск генеральный директор Tether Паоло Ардойно.

Эти модели не только умные, но и очень практичные, как отмечают исследователи. Они быстро отвечают короткими, но полными ответами, экономя время и заряд батареи. Они доступны в сжатых форматах, легко помещающихся на мобильных устройствах без существенной потери качества.

Технически модель объемом 4 миллиарда генерирует ответы примерно из 909 токенов, тогда как аналогичные системы — около 2 953, что сокращает объем вывода в 3,2 раза. Модель объемом 1,7 миллиарда в среднем использует около 1 110 токенов против 1 901, сокращая вывод в 1,7 раза.

Обе модели выпускаются в квантованном формате GGUF, с сжатой версией весом примерно 1,2 ГБ и 2,6 ГБ соответственно.

«Это сочетание важно, потому что оно напрямую снижает требования к вычислениям, задержку и стоимость. Это позволяет запускать модель локально на стандартном оборудовании вместо использования удаленной инфраструктуры», — добавил Ардойно. «В здравоохранении это полностью меняет ограничения; вы можете выполнять медицинское рассуждение там, где уже есть данные, внутри системы больницы или на устройстве, без передачи чувствительной информации через облако или ожидания внешней обработки.»

Модели теперь доступны бесплатно по открытой лицензии на Hugging Face.

Раскрытие информации: Эта статья была отредактирована Вивиан Нгуен. Для получения дополнительной информации о том, как мы создаем и проверяем контент, смотрите нашу редакционную политику.

Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Закрепить