Determinación del número de clustersanálisis de la matriz de disimilaridades
Editorial: Universidad de Murcia. Departamento de Estadística e Investigación Operativa
ISBN: 978-84-691-8159-1
Año de publicación: 2009
Congreso: Congreso Nacional de Estadística e Investigación Operativa (31. 2009. Murcia)
Tipo: Aportación congreso
Resumen
Los metodos de analisis cluster son una herramienta muy popular de clasicacion no supervisada. Su objetivo es descubrir grupos signicativos en un conjunto de datos. En general, buscan clusters bien separados cuyos miembros presentan un alto nivel de similaridad. Uno de los principales problemas que se plantean en el analisis cluster es el de estimar el numero optimo de grupos que hay en un conjunto de datos determinado. En este trabajo se presenta un metodo que determina, simultaneamente, el numero mas probable de grupos que existe en el conjunto de datos, as como la particion de los mismos, a partir de la distribucion de las disimilaridades entre los casos. A continuacion, se compara este metodo con metodos tradicionales de analisis cluster sobre algunos conjuntos de datos, y se comprueba la adecuacion de la clasicacion obtenida, mediante el uso de medidas de validez