IA falha na fase inicial de diagnósticos médicos, aponta pesquisa
Estudo avaliou modelos como ChatGPT, Gemini e Claude em casos clínicos
Por: Redação
16/04/2026 • 07:40
A inteligência artificial (IA) ainda não demonstra desempenho consistente quando aplicada ao processo de diagnóstico médico, especialmente na etapa inicial do raciocínio clínico. É o que mostra um estudo publicado na segunda-feira (13) no JAMA Network Open.
A pesquisa analisou 21 modelos de linguagem, entre eles ChatGPT, DeepSeek, Gemini e Claude, em 29 casos clínicos usados na formação de médicos. O experimento simulou etapas do raciocínio, desde a formulação de hipóteses até a definição de tratamento.
Leia mais:
Google entrega recursos para facilitar comunicação mundial
Terra pode passar por transformação extrema no futuro, aponta estudo da Nasa
Instagram disponibiliza atualização com nova configuração de uso
Na fase inicial, quando os sistemas precisam sugerir possíveis diagnósticos a partir de sintomas e histórico do paciente, a taxa de erro ultrapassou 80%, chegando em alguns modelos a quase 100%. Já na etapa final, com todas as informações disponíveis, o desempenho melhorou, com falhas abaixo de 40% e registros próximos de 9% em alguns casos.
Desempenho entre os modelos
Entre os sistemas avaliados, o Grok 4 ficou 22% abaixo do nível considerado ideal. O Gemini 1.5 Flash teve o pior resultado geral, com desempenho 36% inferior ao esperado.
Os autores do estudo afirmam que, apesar dos avanços recentes da inteligência artificial na medicina, a fase inicial do diagnóstico continua sendo o principal ponto de fragilidade, por exigir a formulação simultânea de múltiplas hipóteses diante de informações incompletas.
Relacionadas
