Aplicación de técnicas de clustering para la estimación del esfuerzo en la construcción de proyectos software
- Juan José Cuadrado Gallego Director
- Miguel Ángel Sicilia Urbán Director
Universidad de defensa: Universidad de Alcalá
Fecha de defensa: 19 de septiembre de 2006
- Daniel Rodríguez García Presidente
- María Elena García Barriocanal Secretaria
- Francisco Ruiz González Vocal
- José Ramón Hilera González Vocal
- Mercedes Ruiz Carreira Vocal
Tipo: Tesis
Resumen
Los modelos paramétricos de estimación de coste del software basados en la utilización de una única ecuación que representa a toda una base de datos de proyectos, ofrecen resultados poco satisfactorios, Esto se debe a diversas razones, una de las cuales reside en el heterogeneidad de los proyectos utilizados en la obtención de dicha ecuación. Se trata entonces de procurar salvar este inconveniente. Para conseguir esto, surgel a idea de dividir esta base de datos de proyectos en grupos de ellos, de manera que los proyectos integrantes sean más homogéneos entre sí. Para realizar esta división de una forma automática y de manera que, efectivamente, proyectos similares se encuentren en el mismo grupo, se recurre a técnicas de Inteligencia Artificial, en concreto a algoritmos de agrupamiento automático o clustering. De ello surge un nuevo modelo, al que se le denomina modelo de estimación paramétrico segmentado. Consiste en la obtención de un conjunto de clusters, o grupos de proyectos, tras la aplicación de un algoritmo de clustering sobre la totalidad de la base de datos de proyectos. Los clusters así obtenidos ofrecen unas características más homogéneas que las que presentaban por separado los proyectos que los constituyen. Para cada uno de los grupos de proyectos obtenidos de esta manera se obtendría, mediante análisis de regresión, su propia ecuación paramétrica. Estas ecuaciones ofrecen, en término medio, después de las pruebas realizadas, mejores resultados que el uso exclusivo de una única ecuación para todos los proyectos de la base de datos. Este proceso se puede repetir de forma recursiva, si se considera conveniente, de manera que sucesivamente se proceda al refinamiento de los clusters que se van constituyendo. Dividir directamente los proyectos de la base de datos, no aprovecha el conocimiento previo que se pueda tener por parte de expertos sobre el comportamiento de los mismos. Con el fin de analizar este aspecto, se han realizado diferentes experimentos, que antes de llevar a cabo el proceso de clusterización, realizan un particionado previo de los proyectos, utilizando el conocimiento que personas expertas tiene sobre la influencia que tienen ciertos conductores de coste sobre el esfuerzo que requiere la realización de un proyecto. De esta manera, a la hora de aplicar el algoritmo de agrupamiento, se partirá de la experiencia y conocimiento ofrecido por estos expertos, que se utilizará para realizar un particionado previo de los datos. La forma en la que se ha llevado a cabo la evaluación del nuevo modelo paramétrico segmentado ha consistido en la comparación del modelo paramétrico clásico, mediante la utilización de los índices MMRE (Mean Magnitude of Relative Error) y PRED(/) (Prediction Level). Estos índices han mostrado unos resultados más satisfactorios utilizando el modelo aquí expuesto que utilizando el tradicional.