Clustering de sistemas de recomendación mediante técnicas de factorización matricial
- BOJORQUE CHASI, RODOLFO
- Jesús Bobadilla Director
- Fernando Ortega Requena Co-director
Defence university: Universidad Politécnica de Madrid
Fecha de defensa: 12 February 2020
- Luis Usero Aragonés Chair
- Abraham Gutiérrez Secretary
- José Jesús García Rueda Committee member
- Santiago Alonso Villaverde Committee member
- Roberto Maestre Martínez Committee member
Type: Thesis
Abstract
La expansión de los sistemas de recomendación a nivel comercial e industrial ha permitido una rápida evolución de técnicas, métodos y algoritmos. Inicialmente las investigaciones se enfocaban en mejorar la calidad de las predicciones; sin embargo, existen desafíos importantes en cuanto a la generación de modelos que permitan el trabajo con los grandes volúmenes de información que actualmente se genera a todos los niveles. La dispersión de los conjuntos de datos es un desafío actual de los sistemas de recomendación. Aplicar técnicas como clustering y explicación de las recomendaciones son problemas de investigación actuales en el área de sistemas de recomendación. Los sistemas de recomendación basados en modelos proveen resultados más precisos, más escalables y abordan de mejor manera el problema de la dispersión. El modelo más adoptado por los sistemas de recomendación modernos es la Factorización Matricial y las técnicas derivadas de este enfoque. Esta tesis expone un estudio exhaustivo de trabajos de investigación del estado del arte y propone el uso de un método de Factorización Matricial no Negativo Bayesiano (BNMF) para mejorar los resultados de clustering de los trabajos más recientes y representativos en el área de filtrado colaborativo. También propone un innovador algoritmo de pre-clustering adaptado al método probabilístico propuesto. Los resultados obtenidos sobre varios conjuntos de datos abiertos demuestran: 1) Mejoras importantes en la calidad de clustering cuando se utiliza BNMF, en comparación con la técnica de Factorización Matricial Clásica y con técnicas mejoradas y recientes del algoritmo k-means, 2) Una mejora en la calidad de las predicciones cuando se utiliza técnicas de clustering basadas en factorización matricial, en comparación con los estudios recientes de k-means, y 3) Mejores tiempos de ejecución de BNMF en comparación con los tiempos de ejecución de la factorización matricial clásica, y una mejora adicional cuando se utiliza el algoritmo de pre-clustering propuesto.