Los bots de IA cometen errores en el diagnóstico casi al 80 %, como se descubrió en un estudio

Los bots de IA cometen errores en el diagnóstico casi al 80 %, como se descubrió en un estudio

2 hardware

Breve sobre los resultados de la investigación

Un estudio reciente publicado en *Jama Network Open* y citado por el *Financial Times* mostró que los chatbots populares no pueden diagnosticar con precisión si se les proporciona un conjunto limitado de datos. En más del 80 % de los casos, daban diagnósticos erróneos; solo cuando se describían completamente los síntomas la precisión aumentaba al 90 %.

Cómo se llevó a cabo el estudio
Paso | Qué hicieron | Selección de casos | 29 escenarios clínicos extraídos de literatura de referencia. | Transferencia de datos | La información del paciente se entregó a los chatbots gradualmente: historia clínica → resultados de exámenes → análisis de laboratorio. | Preguntas al IA | Se preguntaba sobre el diagnóstico; se medía la precisión y exhaustividad de las respuestas.

Participantes del experimento
* 20 modelos populares de OpenAI, Anthropic, Google, xAI, DeepSeek.
* Con datos incompletos, más del 80 % cometían diagnósticos incorrectos.
* A medida que aumentaba la cantidad de información, la precisión mejoraba: en los mejores casos >90 %; en promedio, errores menores al 40 %.

Reacción de los desarrolladores
Empresa | Comentario
Google & Anthropic | Al intentar obtener recomendaciones médicas, los chatbots aconsejan encarecidamente consultar a un especialista.
OpenAI | Indica en sus términos de uso que sus servicios no están destinados a proporcionar recomendaciones médicas licenciadas.
xAI & DeepSeek | No ofrecieron comentarios.

Algunos están desarrollando modelos especializados: Google creó AMIE, que muestra buenos resultados, pero sus conclusiones aún requieren confirmación por un médico vivo, especialmente considerando la importancia de la evaluación visual.

Conclusión
Los chatbots pueden ser útiles como herramienta auxiliar, pero con información limitada suelen equivocarse. Su uso como sustituto de un profesional médico calificado sigue siendo inaceptable, aunque estos modelos podrían servir en regiones con escasez de acceso a medicina tradicional.

Comentarios (0)

Comparte tu opinión — por favor, sé amable y mantente en el tema.

Aún no hay comentarios. Deja un comentario y comparte tu opinión!

Para dejar un comentario, inicia sesión.

Inicia sesión para comentar