DATAI y la Universidad de Salamanca acercan la estadística avanzada a la toma de decisiones con datos
Expertos exploran cómo los modelos estadísticos y de machine learning ayudan a predecir riesgos y mejorar decisiones en ámbitos como la medicina, la economía o la ingeniería

FotoNaiara Carrasco/De derecha a izquierda: José Manuel Sánchez-Santos y Jesús López Fidalgo
22 | 05 | 2025
El Instituto de Ciencia de los Datos e Inteligencia Artificial (DATAI) de la Universidad de Navarra acogió este jueves un nuevo seminario dentro de su ciclo de conferencias científicas, en colaboración con la Universidad de Salamanca. La sesión, titulada “Modeling survival and risk: some regression techniques in survival analysis”, fue impartida por el profesor José Manuel Sánchez-Santos, experto en bioinformática y miembro del Grupo de Investigación en Bioinformática de la Universidad de Salamanca.
Modelos para entender comportamientos complejos
Durante el encuentro, el profesor Sánchez-Santos presentó distintas técnicas estadísticas y de machine learning que permiten construir modelos para predecir comportamientos o resultados en situaciones complejas, como por ejemplo cuándo podría aparecer una enfermedad o qué factores influyen en el riesgo de un evento futuro. “El uso de estas herramientas resulta especialmente útil en contextos donde se trabaja con grandes volúmenes de datos, ya que permiten identificar qué variables son realmente importantes sin perder precisión”, explicó el experto.
Análisis de supervivencia: medir el tiempo hasta un evento clave
Uno de los focos del seminario fue el análisis de supervivencia, una rama de la estadística que permite predecir el tiempo que puede pasar hasta que ocurra un suceso relevante, como una recuperación médica, una avería técnica o un impago financiero. El profesor Sánchez-Santos explicó que, para ello, se emplean herramientas como el estimador de Kaplan-Meier, un método que permite calcular la probabilidad de que un evento ocurra en distintos momentos del tiempo, incluso cuando no se tiene información completa de todos los casos. También destacó el modelo de riesgos proporcionales de Cox, una técnica de regresión que permite identificar qué factores influyen significativamente en el riesgo de que ocurra ese evento. Ambos métodos son ampliamente utilizados por su capacidad de generar modelos predictivos robustos y aplicables en campos como la medicina, la economía o la ingeniería.
De los datos clínicos al tratamiento personalizado
En un enfoque especialmente centrado en la investigación médica, Sánchez-Santos explicó cómo técnicas de regresión como Lasso, Ridge y Elastic Net permiten identificar marcadores de riesgo y supervivencia de forma robusta. Estas herramientas, propias del aprendizaje automático, ayudan a seleccionar las variables más relevantes dentro de un gran conjunto de datos, eliminando aquellas menos significativas o redundantes. Mientras Lasso tiende a seleccionar un número reducido de variables clave, Ridge las ajusta suavemente sin excluir ninguna, y Elastic Net combina ambas estrategias para lograr un equilibrio eficaz. El experto también subrayó la importancia de la validación cruzada, un proceso que permite evaluar la estabilidad de los resultados obtenidos y garantizar que los marcadores identificados se mantengan consistentes en distintos subconjuntos de datos. Esta solidez es clave para avanzar en la personalización de tratamientos y mejorar el pronóstico clínico de los pacientes.
El seminario incluyó también ejemplos reales de conjuntos de datos biomédicos, especialmente en casos de cáncer, donde estas metodologías no solo validan biomarcadores ya conocidos, sino que permiten descubrir otros nuevos. Según Jesús López Fidalgo, director del Instituto de Ciencia de los Datos e Inteligencia Artificial (DATAI), “esta integración de la estadística avanzada con la bioinformática abre nuevas vías en la investigación traslacional y mejora significativamente la toma de decisiones clínicas en contextos de alta incertidumbre”.
Este seminario forma parte del ciclo de charlas científicas que DATAI organiza con expertos nacionales e internacionales, y refuerza su compromiso con la comunicación de la ciencia de datos de manera rigurosa, útil y accesible para quienes deben tomar decisiones en entornos complejos.