Application of predictive analytics techniques to public data and social media in healthcare
- Marçal Mora Cantallops Director
- Salvador Sánchez Alonso Co-director
Defence university: Universidad de Alcalá
Fecha de defensa: 18 December 2023
- Ricardo Colomo Palacios Chair
- María Elena García Barriocanal Secretary
- Javier Bermejo Higuera Committee member
Type: Thesis
Abstract
El mundo está presenciando actualmente un aumento en la generación de datos, principalmente debido a la rápida digitalización. Una parte significativa de estos datos, especialmente en forma de texto no estructurado, permanece infrautilizada. Los avances en Inteligencia Artificial (IA) y Procesamiento de Lenguaje Natural (PLN) permiten el análisis automatizado de texto no estructurado. Esta tesis se centra en el desarrollo de técnicas de PLN para análisis predictivo utilizando amplios conjuntos de datos textuales de repositorios públicos. La tesis comienza con una revisión sistemática de la literatura, empleando la modelización de temas impulsada por PLN y análisis de grafos para evaluar 7.928 artículos científicos. Destaca el creciente interés en el campo del análisis de redes sociales como sistema predictivo. Se identifica una brecha en la utilización de datos de plataformas sociales en el ámbito de la salud. Para abordarlo, se lleva a cabo un estudio bibliométrico centrado en el campo de la salud, revisando 492 artículos en dicho ámbito. Se identifican aplicaciones en salud pública, seguridad del paciente y vigilancia de brotes de enfermedades, especialmente en lo que respecta al impacto de las noticias falsas en la seguridad del paciente y los procesos de toma de decisiones. La tesis también explora el apoyo a líderes empresariales y organizaciones de salud en el desarrollo de estrategias a través del análisis de redes sociales. Se han analizado 96.826 tuits relacionados con la transformación digital en el ámbito de la salud, así como se ha examinado la relación entre las tecnologías de la Industria 4.0 y las tendencias en salud digital a través de la minería de noticias, recopilando 74.813 titulares y 59.818 artículos de noticias de la Base de Datos Global de Eventos, Lenguaje y Tono (GDELT). Además, el estudio destaca el potencial de integrar datos textuales no estructurados con información estructurada de diversas fuentes, incluyendo Scopus, Twitter y GDELT. La tesis enfatiza que estos métodos pueden extrapolarse a campos más allá de la salud. En conclusión, la tesis demuestra la aplicación práctica del análisis de redes sociales y la minería de noticias en el apoyo a la toma de decisiones basada en datos para las organizaciones de salud y se destaca cómo la IA y el PLN pueden desbloquear el potencial latente de datos fácilmente accesibles a través de técnicas efectivas.