Detección de fatiga en conductores mediante fusión de sistemas ADAS

  1. García Daza, Iván
Dirigida por:
  1. Rafael Barea Navarro Codirector
  2. Luis M. Bergasa Pascual Codirector

Universidad de defensa: Universidad de Alcalá

Fecha de defensa: 14 de octubre de 2011

Tribunal:
  1. Luciano Boquete Vázquez Presidente
  2. Miguel Angel García Garrido Secretario
  3. Enrique Cabello Pardos Vocal
  4. David Tobias Sandberg Vocal
  5. Arturo de la Escalera Hueso Vocal
Departamento:
  1. Electrónica

Tipo: Tesis

Resumen

Se ha identificado la somnolencia como una de las causas más importante de accidentes de tráfico, ya que se encuentra implicada en el 20 % de los mismos, por lo que existe un interés creciente en encontrar sistemas ADAS (Advanced Driver Assistance Systems) capaces de detectar el estado de fatiga del conductor para prevenir posibles accidentes. Esto hace que las investigaciones en este ámbito sean de vital importancia. Para abordar el análisis de la somnolencia durante la conducción, distintos grupos de investigadores han trabajado en diversas técnicas, entre las que destaca la Visión por Computador dado que permite, mediante el uso de una tecnología relativamente barata, la monitorización del conductor de forma no intrusiva. En esta tesis se propone una técnica, basada en el procesado de imágenes monoculares consistente en la detección, seguimiento y caracterización de la apertura de los ojos, que trabaja automáticamente con distintos usuarios y en condiciones de conducción real. A partir de esta información y de otras señales relativas a la conducción, se infiere la somnolencia del conductor. Las señales relativas al conductor se han obtenido de una amplia colección de vídeos de la cara de diferentes conductores, en simulación y en condiciones reales, en estado normal y de privación de sueño. Además, se dispone de numerosas señales relativas a la conducción, como la posición del vehículo en el carril, el angulo de giro del volante, el error del angulo de guiñada, etc. Para la evaluación de la somnolencia en el conductor es necesario generar una señal de referencia que indique el estado del mismo. Esta señal se obtiene, por tres expertos, del estudio del índice de Karolinska (KSS), de la información facial extraída de los vídeos del conductor y de las señales registradas en la conducción. Normalmente, la señal de referencia consta de dos niveles: vigilia y somnolencia, pero en esta tesis se ha ampliado a un tercero, el de fatiga, para intentar mejorar la clasificación del estado del conductor. Tras un análisis de esta opción se ha concluido que la mejor clasificación es la binaria. Esta metodología es nueva ya que fusiona la información KSS con la proporcionada por expertos. Con los vídeos de la cara del conductor y técnicas de procesado de imágenes se ha evaluado la apertura de los ojos. Para la detección de la cara se ha empleado el algoritmo de detección por apariencia de Viola y Jones, y para la de los ojos se ha mejorado con técnicas de clustering y un filtro de Kalman como predictor. La medida de la apertura de los ojos se ha obtenido aplicando filtros adaptativos, integrales proyectivas y un modelo Gaussiano cuya desviación estándar coincide con la apertura, consiguiendo un sistema en tiempo real y robusto frente a cambios de iluminación. Conocida la apertura se calcula el Porcentaje de Ojo Cerrado (PERCLOS), que es uno de los indicadores más importantes en la detección de somnolencia. De las señales relativas a la conducción, que son dependientes de cada conductor, se han obtenido indicadores calculados con ventanas temporales como son: desviación estándar (std) y error cuadrático medio (mse) de la posición del vehículo en el carril, fracción de tiempo que el vehículo está fuera del carril (Lanex), tiempo estimado en cruzar los límites del carril (TLC), desviación estándar y movimientos rápidos del angulo de giro del volante, desviación estándar del error del angulo de guiñada e indicadores genéricos de variabilidad (GVI). Para eliminar la dependencia de los indicadores con cada uno de los conductores, se aplican algoritmos genéticos para optimizar una función objetivo que tiene en cuenta a la señal de referencia. Para determinar el estado del conductor se han fusionado indicadores entre sí mediante una red neuronal Perceptrón Multicapa, en donde el número de neuronas de la capa oculta se ha ajustado con el cálculo de la curva ROC. Se han expuestos resultados en condiciones de simulación y en condiciones reales. La clasificación se ha realizado con indicadores individuales y fusionándolos, presentando los resultados en diagramas de error, en diagramas de tela de araña y en tablas donde se muestra la tasa de aciertos, especificidad, sensibilidad y valor de la función objetivo. Los resultados obtenidos sobre la detección de somnolencia demuestran que la utilización del PERCLOS es determinante para la estimación del estado del conductor y que su fusión con otros indicadores de conducción mejora su tasa de aciertos individual. Los indicadores relacionados con la conducción obtienen peores resultados que el PERCLOS porque sus señales no sólo están motivadas por la somnolencia sino también por factores relacionados con la trayectoria de la carretera. El error del angulo de guiñada se ha evaluado sólo en simulación puesto que en condiciones reales es difícil de estimar y no se disponía de el. En simulación las dos mejores combinaciones son la fusión entre el PERCLOS y la desviación estándar del error del angulo de guiñada y el PERCLOS y el indicador mse optimizado. En condiciones reales la mejor combinación es el PERCLOS y mse optimizado. Si se hubiera tenido el error del angulo de guiñada en condiciones reales quizás hubiera dado el mejor porcentaje en la clasificación, superando inclusive la fusión del PERCLOS con el indicador mse optimizado en condiciones reales, por lo tanto, los resultados obtenidos avalan la metodología empleada que traslada los resultados del simulador naturalista a las condiciones reales, extrayendo conclusiones válidas para las condiciones reales con porcentajes de detección menores debido al mayor ruido asociado a las señales. En simulación, se ha revelado como un buen indicador de somnolencia por su independencia con respecto a la trayectoria. La fusión entre las señales de PERCLOS y angulo de guiñada ha sido la que ha alcanzado mayor tanto por ciento de detección. En términos generales, los resultados obtenidos están en concordancia con otros importantes trabajos sobre detección de somnolencia [Sandberg, 2011], a excepción de la discusión sobre la importancia de la variable PERCLOS ya que, en esta tesis, se concluye que es el mejor indicador de somnolencia debido, probablemente, a que el sistema de visión desarrollado para su obtención es propietario y no comercial. Por otro lado, los resultados de detección obtenidos son mejores que en otros importantes trabajos referenciados del estado del arte [Friedrichs & Yang, 2010a, Caterpillar, 2008].