Análisis de la importancia de las características de la esteatohepatitis no alcohólica aplicando modelos Random Forest

  1. R. Holgado-Cuadrado 1
  2. R. García-Carretero 2
  3. O. Barquero-Pérez 1
  1. 1 Universidad Rey Juan Carlos, Fuenlabrada, España
  2. 2 Servicio Medicina Interna, Hospital Universitario de Móstoles, Móstoles, España
Libro:
XXXVIII Congreso Anual de la Sociedad Española de Ingeniería Biomédica. CASEIB 2020: Libro de actas
  1. Roberto Hornero Sánchez (ed. lit.)
  2. Jesús Poza Crespo (ed. lit.)
  3. Carlos Gómez Peña (ed. lit.)
  4. María García Gadañón (ed. lit.)

Editorial: Grupo de Ingeniería Biomédica ; Universidad de Valladolid

ISBN: 978-84-09-25491-0

Año de publicación: 2020

Páginas: 177-180

Congreso: Congreso Anual de la Sociedad Española de Ingeniería Biomédica CASEIB (38. 2020. Valladolid)

Tipo: Aportación congreso

Resumen

la actualidad, la enfermedad hepática crónica más prevalente. Una de las manifestaciones más típicas es la esteatohepatitis no alcohólica (EHNA), que puede derivar en cirrosis. Existen, no obstante, dos problemas por resolver, a saber, (1) crear diagnósticos precoces y no invasivos, y (2) entender mejor la base fisiopatológica del desarrollo de la enfermedad para conseguir tratamientos eficaces. El objetivo del trabajo fue diseñar un modelo predictivo para estimar la probabilidad de EHNA, e identificar las variables más relevantes en el desarrollo de la enfermedad. Para ello, se han analizado los datos de 2.828 pacientes hipertensos utilizando técnicas de machine learning, incluyendo modelos Random Forest, estrategias de desbalanceo de datos y herramientas de interpretación que permiten identificar los factores más relevantes para determinar la probabilidad de EHNA. Los resultados sugieren que los niveles sanguíneos de gamma glutamil transferasa y ferritina, así como la función renal (ckdepi- creatinina) fueron los factores más relevantes a la hora de predecir la probabilidad de EHNA. Los modelos propuestos consiguieron una sensibilidad y especificidad del 70%, y un área bajo la curva ROC de 0,70. El modelo propuesto permite identificar las contribuciones de cada una de las variables identificadas para estimar la probabilidad final de EHNA, permitiendo caracterizar el impacto en cada paciente individual de sus variables fisiológicas.