Clustering de sistemas de recomendación mediante técnicas de factorización matricial

  1. BOJORQUE CHASI, RODOLFO
Dirigida por:
  1. Jesús Bobadilla Director/a
  2. Fernando Ortega Requena Codirector/a

Universidad de defensa: Universidad Politécnica de Madrid

Fecha de defensa: 12 de febrero de 2020

Tribunal:
  1. Luis Usero Aragonés Presidente
  2. Abraham Gutiérrez Secretario/a
  3. José Jesús García Rueda Vocal
  4. Santiago Alonso Villaverde Vocal
  5. Roberto Maestre Martínez Vocal

Tipo: Tesis

Teseo: 604996 DIALNET

Resumen

La expansión de los sistemas de recomendación a nivel comercial e industrial ha permitido una rápida evolución de técnicas, métodos y algoritmos. Inicialmente las investigaciones se enfocaban en mejorar la calidad de las predicciones; sin embargo, existen desafíos importantes en cuanto a la generación de modelos que permitan el trabajo con los grandes volúmenes de información que actualmente se genera a todos los niveles. La dispersión de los conjuntos de datos es un desafío actual de los sistemas de recomendación. Aplicar técnicas como clustering y explicación de las recomendaciones son problemas de investigación actuales en el área de sistemas de recomendación. Los sistemas de recomendación basados en modelos proveen resultados más precisos, más escalables y abordan de mejor manera el problema de la dispersión. El modelo más adoptado por los sistemas de recomendación modernos es la Factorización Matricial y las técnicas derivadas de este enfoque. Esta tesis expone un estudio exhaustivo de trabajos de investigación del estado del arte y propone el uso de un método de Factorización Matricial no Negativo Bayesiano (BNMF) para mejorar los resultados de clustering de los trabajos más recientes y representativos en el área de filtrado colaborativo. También propone un innovador algoritmo de pre-clustering adaptado al método probabilístico propuesto. Los resultados obtenidos sobre varios conjuntos de datos abiertos demuestran: 1) Mejoras importantes en la calidad de clustering cuando se utiliza BNMF, en comparación con la técnica de Factorización Matricial Clásica y con técnicas mejoradas y recientes del algoritmo k-means, 2) Una mejora en la calidad de las predicciones cuando se utiliza técnicas de clustering basadas en factorización matricial, en comparación con los estudios recientes de k-means, y 3) Mejores tiempos de ejecución de BNMF en comparación con los tiempos de ejecución de la factorización matricial clásica, y una mejora adicional cuando se utiliza el algoritmo de pre-clustering propuesto.