Los modelos de IA avanzados no alcanzan el razonamiento clínico de los médicos

Estás a punto de abandonar RED Amgen para conectarte a una fuente externa

RED Amgen no audita o controla el contenido de las fuentes externas. Asimismo, tampoco se hace responsable del contenido que encuentres en el siguiente enlace.

Aceptar y salir

Espacio Amgen

ACCEDE REGÍSTRATE

Actualidad

04 DIC 2025

Los modelos de IA avanzados no alcanzan el razonamiento clínico de los médicos

En los últimos años, las posibilidades de la inteligencia artificial (IA) en la salud han dado un paso de gigante, con aplicaciones en el diagnóstico por la imagen, la búsqueda de patrones en datos de salud y la toma de notas clínicas durante las visitas, entre otras.

Y es que los grandes modelos de lenguaje (LLM, por las siglas en inglés) han demostrado habilidad para superar exámenes médicos de tipo test. Pero no está claro cómo de bien se desenvuelven en términos de razonamiento clínico, especialmente a la hora de adaptarse a información cambiante en la evaluación de un caso.

Investigadores internacionales recurrieron al test de concordancia de guion o script concordance testing (SCT) —un método para evaluar la flexibilidad en el razonamiento clínico de los estudiantes de medicina— para poner a prueba diez LLM, algunos de los cuales desarrollados como modelos razonamiento.

Los modelos de IA fueron ineficaces para identificar cuándo los nuevos datos eran irrelevantes

En base a conjuntos de datos internacionales de distintas especialidades médicas, los autores crearon una herramienta con 750 SCT, cada uno de los cuales con una situación o viñeta clínica en que nuevos datos pueden alterar el diagnóstico y el plan de tratamiento. El rendimiento de los diez LLM a la hora de resolver estas viñetas se comparó con el de un millar de estudiantes de medicina, 193 residentes y 300 médicos.

Los resultados revelan que, en general, los modelos de IA avanzados obtuvieron rendimientos similares a los de estudiantes de primer o segundo año, pero no alcanzaron el nivel de residentes y médicos experimentados. Y es que alrededor de un 30% de la nueva información proporcionada en los SCT no alteraba el diagnóstico. Sin embargo, los LLM fueron muy ineficaces a la hora de averiguarlo, e intentaban encajar estos datos irrelevantes en su resultado final.

Según los autores, el estudio pone de relieve las limitaciones de la IA en el razonamiento clínico, incluso entre aquellos modelos optimizados para el razonamiento explícito. Y consideran que la herramienta desarrollada, disponible públicamente, puede servir como complemento para evaluar nuevos modelos de IA de aplicación en la atención sanitaria.

Fuente: University of Alberta.

Referencia
McCoy LG, Swamy R, Sagar N, et al. Assessment of Large Language Models in Clinical Reasoning: A Novel Benchmarking Study. NEJM AI. 2025;2(10):10.1056/AIdbp2500120. doi:10.1056/AIdbp2500120

OAD-ES-AMG-0001

#Innovacion

#InteligenciaArtificial

#TecnologiaSalud

Lo más leído

¿Por qué registrarse?

Un espacio específico para ti y tu especialidad
Tus contenidos favoritos
Acceso a toda la actualidad científica
Formación especializada
Soportes y herramientas prácticas
Acceso a tu Área privada
Información actualizada sobre los productos Amgen
Notifica sospechas de reacciones adversas

¿Ya tienes cuenta de OWA? ACCEDE AHORA

Para que te sea más fácil recordar tus datos de acceso a RED Amgen, utilizamos el servicio de autenticación segura OneKey Web Authentication (OWA), empleado por distintas páginas web sanitarias.

E-mail

Contraseña (mínimo 6 carácteres) pwd_visibility_icon

Confirmar contraseña

Apelativo

Nombre

Apellidos

Profesión

Campo obligatorio

Especialidad

Campo obligatorio

Código postal

Ciudad

País

Teléfono (introduce un número de teléfono válido)

El número telefónico compartido será utilizado única y exclusivamente para verificar que el usuario es profesional sanitario, no para fines comerciales.

He leído y acepto el aviso legal He leído y acepto el aviso legal

He leído y acepto la política de privacidad He leído y acepto la política de privacidad

Proceso de indentificación vía OWA

Estamos validando tus datos, en las próximas 48h el equipo de OWA (One Key authentication) se pondrá en conctacto contigo para finalizar el proceso de registro.

entendido

¡Gracias por registrarte!

Gracias por realizar el proceso de registro. Ya puedes acceder a todo el contenido de RED Amgen.

ACCEDE AHORA

Necesitamos validar tus credenciales:

Para poder validar tus datos mediante OWA, necesitamos que modifiques tus datos haciendo clic AQUÍ

¡Muchas gracias!

entendido

KRAS: un biomarcador clave en cáncer de pulmón no microcítico (CPNM)

La importancia de los biomarcadores en el manejo del CCRm

ONCONNECT: Conectando actualidad y formación en oncología

Cáncer de Pulmón: ¿Tienes un momento?

600 Segundos

Los modelos de IA avanzados no alcanzan el razonamiento clínico de los médicos

Lo más leído

KRAS: un biomarcador clave en cáncer de pulmón no microcítico (CPNM)

La importancia de los biomarcadores en el manejo del CCRm

ONCONNECT: Conectando actualidad y formación en oncología

Cáncer de Pulmón: ¿Tienes un momento?

600 Segundos

Los modelos de IA avanzados no alcanzan el razonamiento clínico de los médicos

Puede interesarte

Un proyecto español recurre a la IA para entrenar la empatía en futuros médicos

Beneficios y riesgos de recurrir a chatbots de IA para obtener consejos de salud

¿Puede la IA ser el engranaje definitivo hacia una verdadera salud digital?

Lo más leído

7.ª Edición del Manual Práctico de Hematología Clínica

Presentación de la Guía Práctica para la puesta en marcha de Unidades de Coordinación de Fracturas de Cadera en la Comunidad de Madrid

Espacio de Información Médica: Información científica y actualizada de nuestros medicamentos

SEMERGENVIVO: “Desmontando mitos en Osteoporosis: La importancia del médico de familia”

Acceso a RED Amgen

Restaurar contraseña