Determinación del número de clustersanálisis de la matriz de disimilaridades

  1. Rivera Galicia, Luis Felipe
Libro:
XXXI Congreso Nacional de Estadística e Investigación Operativa ; V Jornadas de Estadística Pública: Murcia, 10-13 de febrero de 2009 : Libro de Actas

Editorial: Universidad de Murcia. Departamento de Estadística e Investigación Operativa

ISBN: 978-84-691-8159-1

Año de publicación: 2009

Congreso: Congreso Nacional de Estadística e Investigación Operativa (31. 2009. Murcia)

Tipo: Aportación congreso

Resumen

Los metodos de analisis cluster son una herramienta muy popular de clasi cacion no supervisada. Su objetivo es descubrir grupos signi cativos en un conjunto de datos. En general, buscan clusters bien separados cuyos miembros presentan un alto nivel de similaridad. Uno de los principales problemas que se plantean en el analisis cluster es el de estimar el numero optimo de grupos que hay en un conjunto de datos determinado. En este trabajo se presenta un metodo que determina, simultaneamente, el numero mas probable de grupos que existe en el conjunto de datos, as como la particion de los mismos, a partir de la distribucion de las disimilaridades entre los casos. A continuacion, se compara este metodo con metodos tradicionales de analisis cluster sobre algunos conjuntos de datos, y se comprueba la adecuacion de la clasi cacion obtenida, mediante el uso de medidas de validez