O Grupo de Pesquisa em IA da Tether lançou o QVAC MedPsy-1.7B e o MedPsy-4B, modelos de linguagem médica especializados apenas em texto, construídos para rodar diretamente em dispositivos de baixo consumo, como smartphones e wearables.

Segundo a equipe, esses modelos superam alguns grandes sistemas de IA médica, incluindo o da Google, em várias avaliações, e apresentam desempenho comparável a sistemas muito maiores em tarefas de raciocínio e conhecimento médico, mantendo execução totalmente local e privacidade.

Sistemas tradicionais de IA na saúde dependem de modelos hospedados na nuvem, exigindo que dados sensíveis, como registros de pacientes e entradas de diagnóstico, sejam transmitidos para servidores externos, criando riscos de privacidade e conformidade. Essa arquitetura enfrenta crescente pressão à medida que o setor de IA médica deve crescer de aproximadamente 36 bilhões de dólares atualmente para potencialmente mais de 500 bilhões até 2033.

A equipe da Tether afirma que o QVAC MedPsy desafia o paradigma de escalabilidade ao focar na eficiência.

O modelo de 1,7B é compatível com smartphones. Essa versão pequena obteve 62,62 em sete avaliações médicas padrão, superando o MedGemma-1.5-4B-it da Google em mais de 11 pontos, apesar de ter menos da metade do tamanho, segundo os pesquisadores. Também superou o MedGemma 27B em tarefas clínicas do mundo real, como o HealthBench Hard.

A versão de 4B atingiu 70,54 nos mesmos testes, ultrapassando o MedGemma-27B, um modelo quase sete vezes maior. Demonstrou forte desempenho no HealthBench, HealthBench Hard e MedXpertQA.

Esses resultados abrangem oito conjuntos de avaliações, incluindo MedQA, MedMCQA, MMLU Health, PubMedQA, AfriMedQA, MedXpertQA e HealthBench, alimentados por treinamento médico em etapas, combinando supervisão, dados curados de raciocínio clínico e aprendizagem por reforço.

“Com o QVAC MedPsy, nosso foco foi melhorar a eficiência ao nível do modelo, ao invés de aumentar o tamanho,” comentou o CEO da Tether, Paolo Ardoino, sobre o lançamento.

Esses modelos não são apenas inteligentes, mas também muito práticos, como observam os pesquisadores. Respondem rapidamente com respostas curtas, porém completas, economizando tempo e bateria. Estão disponíveis em formatos comprimidos fáceis de usar, que cabem confortavelmente em dispositivos móveis sem perder muita qualidade.

Tecnicamente, o modelo de 4B gera respostas em aproximadamente 909 tokens, em comparação com cerca de 2.953 para sistemas comparáveis, uma redução de 3,2 vezes. O modelo de 1,7B tem uma média de cerca de 1.110 tokens contra 1.901, reduzindo a saída em 1,7 vezes.

Ambos os modelos estão sendo lançados em formato quantizado GGUF, com versões comprimidas pesando aproximadamente 1,2 GB e 2,6 GB, respectivamente.

“Essa combinação importa porque reduz diretamente os requisitos de computação, latência e custo. Permite que o modelo rode localmente em hardware padrão, ao invés de depender de infraestrutura remota,” acrescentou Ardoino. “Na saúde, isso muda completamente as restrições; você pode realizar raciocínio médico onde os dados já existem, dentro de um sistema hospitalar ou em um dispositivo, sem mover informações sensíveis pela nuvem ou esperar por processamento externo.”

Os modelos já estão disponíveis gratuitamente sob uma licença aberta na Hugging Face.

                    **Divulgação:** Este artigo foi editado por Vivian Nguyen. Para mais informações sobre como criamos e revisamos o conteúdo, consulte nossa Política Editorial.

Ver original

Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.

Recompensa
gostar
Comentar
Republicar
Partilhar

Comentar

Adicionar um comentário

Nenhum comentário

Tópicos em destaque
Ver mais
#
GateSquareMayTradingShare
992.14K Popularidade
#
BTCBackAbove80K
59.44M Popularidade
#
IsraelStrikesIranBTCPlunges
45.56K Popularidade
#
JapanTokenizesGovernmentBonds
1.9M Popularidade
#
#DailyPolymarketHotspot
866.31K Popularidade

Fixar

A Tether lança IA médica no dispositivo que supera os modelos do Google em testes de referência

Tópicos em destaque

GateSquareMayTradingShare

BTCBackAbove80K

IsraelStrikesIranBTCPlunges

JapanTokenizesGovernmentBonds

#DailyPolymarketHotspot

Fixar