¿Cómo valorar si un modelo de IA está preparado para dedicarse a la ciencia?

Estás a punto de abandonar RED Amgen para conectarte a una fuente externa

RED Amgen no audita o controla el contenido de las fuentes externas. Asimismo, tampoco se hace responsable del contenido que encuentres en el siguiente enlace.

Aceptar y salir

Espacio Amgen

ACCEDE REGÍSTRATE

Actualidad

12 MAR 2026

¿Cómo valorar si un modelo de IA está preparado para dedicarse a la ciencia?

El desarrollo de modelos más avanzados de inteligencia artificial (IA), especialmente los denominados agentes de IA —sistemas que actúan de forma independiente para realizar tareas en múltiples etapas— es visto a menudo como un paso adelante hacia herramientas capaces de realizar investigación científica de forma autónoma o casi. ¿Pero cómo se puede evaluar dicha capacidad?

Un reportaje en la revista Science pone el acento en el desarrollo de múltiples benchmarks o pruebas de referencia para analizar si una IA está preparada para dedicarse a la ciencia. Se trata de conjuntos de preguntas o tareas que permiten puntuar el rendimiento de los modelos y comparar entre ellos.

El trabajo pone de relieve tanto las ventajas como las debilidades de varios de estos test, como el Humanity’s Last Exam, uno de los más populares. Dicha prueba incorpora 2.500 preguntas muy especializadas de distintas disciplinas, pero algunos críticos argumentan que demostrar conocimientos altamente específicos no implica poseer una capacidad real para realizar descubrimientos.

Los resultados de los test pueden servir para mejorar los modelos

La noticia menciona otras benchmarks, como FrontierScience o Scientific Discovery Evaluation (SDE), diseñadas para evaluar específicamente las capacidades de razonamiento científico de la IA. Los resultados con la SDE muestran que los modelos que responden correctamente a preguntas individuales no siempre tienen un buen rendimiento en proyectos de investigación completos, y viceversa.

Más allá de la capacidad de razonamiento científico, LABBench2 se ha desarrollado para testear si los agentes de IA podrían llevar a cabo una investigación en biología desde la idea inicial hasta la publicación de los resultados. Esta prueba ha revelado dificultades a la hora de cruzar o interpretar datos, por lo que sería necesario mejorar el modo en que estas herramientas recuperan la información.

Teniendo en cuenta las complejidades del proceso científico, el artículo apunta que disponer de distintas pruebas de referencia no solo es útil para realizar comparaciones entre modelos de IA, sino que también puede indicar el camino a seguir para mejorarlos y que se conviertan en herramientas útiles para la investigación.

Referencia
Zhao C. How will we know if AI is smart enough to do science?. Science. Published online February 27, 2026. doi:10.1126/science.znoj7w3

OAD-ES-AMG-0001

#Innovacion

#InteligenciaArtificial

#Investigacion

#Desarrollo

Lo más leído

¿Por qué registrarse?

Un espacio específico para ti y tu especialidad
Tus contenidos favoritos
Acceso a toda la actualidad científica
Formación especializada
Soportes y herramientas prácticas
Acceso a tu Área privada
Información actualizada sobre los productos Amgen
Notifica sospechas de reacciones adversas

¿Ya tienes cuenta de OWA? ACCEDE AHORA

Para que te sea más fácil recordar tus datos de acceso a RED Amgen, utilizamos el servicio de autenticación segura OneKey Web Authentication (OWA), empleado por distintas páginas web sanitarias.

E-mail

Contraseña (mínimo 6 carácteres) pwd_visibility_icon

Confirmar contraseña

Apelativo

Nombre

Apellidos

Profesión

Campo obligatorio

Especialidad

Campo obligatorio

Código postal

Ciudad

País

Teléfono (introduce un número de teléfono válido)

El número telefónico compartido será utilizado única y exclusivamente para verificar que el usuario es profesional sanitario, no para fines comerciales.

He leído y acepto el aviso legal He leído y acepto el aviso legal

He leído y acepto la política de privacidad He leído y acepto la política de privacidad

Proceso de indentificación vía OWA

Estamos validando tus datos, en las próximas 48h el equipo de OWA (One Key authentication) se pondrá en conctacto contigo para finalizar el proceso de registro.

entendido

¡Gracias por registrarte!

Gracias por realizar el proceso de registro. Ya puedes acceder a todo el contenido de RED Amgen.

ACCEDE AHORA

Necesitamos validar tus credenciales:

Para poder validar tus datos mediante OWA, necesitamos que modifiques tus datos haciendo clic AQUÍ

¡Muchas gracias!

entendido

KRAS: un biomarcador clave en cáncer de pulmón no microcítico (CPNM)

La importancia de los biomarcadores en el manejo del CCRm

ONCONNECT: Conectando actualidad y formación en oncología

Cáncer de Pulmón: ¿Tienes un momento?

600 Segundos

¿Cómo valorar si un modelo de IA está preparado para dedicarse a la ciencia?

Lo más leído

KRAS: un biomarcador clave en cáncer de pulmón no microcítico (CPNM)

La importancia de los biomarcadores en el manejo del CCRm

ONCONNECT: Conectando actualidad y formación en oncología

Cáncer de Pulmón: ¿Tienes un momento?

600 Segundos

¿Cómo valorar si un modelo de IA está preparado para dedicarse a la ciencia?

Puede interesarte

¿Cómo minimizar los riesgos de integrar la IA en flujos de trabajo científicos?

El razonamiento clínico sigue siendo el talón de Aquiles de la IA generativa

¿Pueden los laboratorios robóticos con IA tomar las riendas de la investigación?

Lo más leído

7.ª Edición del Manual Práctico de Hematología Clínica

Presentación de la Guía Práctica para la puesta en marcha de Unidades de Coordinación de Fracturas de Cadera en la Comunidad de Madrid

Espacio de Información Médica: Información científica y actualizada de nuestros medicamentos

SEMERGENVIVO: “Desmontando mitos en Osteoporosis: La importancia del médico de familia”

Acceso a RED Amgen

Restaurar contraseña