Face tracking with active models for a driver monitoring application
- Nuevo Chiquero, Jesús
- Luis M. Bergasa Pascual Director
Universidad de defensa: Universidad de Alcalá
Fecha de defensa: 30 de octubre de 2009
- Miguel Angel Sotelo Vázquez Presidente
- Rafael Barea Navarro Secretario
- Lennart Svensson Vocal
- Enrique Cabello Pardos Vocal
- Luis Baumela Molina Vocal
Tipo: Tesis
Resumen
La falta de atención durante la conducción es una de las principales causas de accidentes de tráfico. La monitorización del conductor para detectar inatención es un problema complejo, que incluye elementos fisiológicos y de comportamiento. Un sistema de Visión Computacional para detección de inatención se compone de varios etapas de procesado, y esta tesis se centra en el seguimiento de la cara del conductor. La tesis doctoral propone un nuevo conjunto de vídeos de conductores, grabados en un vehículo real y en dos simuladores realistas, que contienen la mayoría de los comportamientos presentes en la conducción, incluyendo gestos, giros de cabeza, interacción con el sistema de sonido y otras distracciones, y somnolencia. Esta base de datos, RS-DMV, se emplea para evaluar el rendimiento de los métodos que propone la tesis y otros del estado del arte. La tesis analiza el rendimiento de los Modelos Activos de Forma (ASM), y de los Modelos Locales Restringidos (CLM), por considerarlos a priori de interés. En concreto, se ha evaluado el método Stacked Trimmed ASM (STASM), que integra una serie de mejoras sobre el ASM original, mostrando una alta precisión en todas las pruebas cuando la cara es frontal a la cámara, si bien no funciona con la cara girada y su velocidad de ejecución es muy baja. CLM es capaz de ejecutarse con mayor rapidez, pero tiene una precisión mucho menor en todos los casos. El tercer método a evaluar es el Modelado y Seguimiento Simultáneo (SMAT), que caracteriza la forma y la textura de manera incremental, a partir de muestras encontradas previamente. La textura alrededor de cada punto de la forma que define la cara se modela mediante un conjunto de grupos (clusters) de muestras pasadas. El trabajo de tesis propone 3 métodos de clustering alternativos al original para la textura, y un modelo de forma entrenado off-line con una función de ajuste robusta. Los métodos alternativos propuestos obtienen una amplia mejora tanto en la precisión del seguimiento como en la robustez de éste frente a giros de cabeza, oclusiones, gestos y cambios de iluminación. Los métodos propuestos tienen, además, una baja carga computacional, y son capaces de ejecutarse a velocidades en torno a 100 imágenes por segundo en un computador de sobremesa.