Pedestrian path, intention and pose prediction through gaussian process dynamical models and pedestrian activity recognition
- QUINTERO MÍNGUEZ, RAÚL
- Miguel Angel Sotelo Vázquez Director
- Ignacio Parra Alonso Codirector
Universidad de defensa: Universidad de Alcalá
Fecha de defensa: 14 de julio de 2017
- Arturo de la Escalera Hueso Presidente/a
- David Fernández Llorca Secretario
- Dariu Gavrila Vocal
Tipo: Tesis
Resumen
Debido al elevado número de muertes en carretera, a lo largo de los últimos años los vehículos han ido evolucionando hasta llegar a ser máquinas inteligentes con tecnologías avanzadas tales como Sistemas de Protección de Peatones, Sistemas de Frenado Automático de Emergencia u otro tipo de Sistemas Avanzados de Asistencia al Conductor. Mejorar estos avances tecnológicos es imprescindible ya que, por ejemplo, iniciar la frenada lo antes posible o evaluar de forma precisa las posiciones de los peatones antes de una colisión podrían ser tareas particularmente relevantes como aseguran varios trabajos. Esta tesis describe un método basado en B-GPDMs, los cuales aprenden información tridimensional y temporal procedente de diferentes puntos situados a lo largo de los cuerpos de los peatones con el objetivo de predecir sus trayectorias, posturas e intenciones futuras con una antelación de hasta un 1 segundo. Dado que los humanos no son objetos rígidos, es importante analizar el movimiento de cada parte del cuerpo. Por tanto, la información de los puntos situados sobre el peatón es significativamente valiosa a la hora de llevar a cabo dichas tareas. El B-GPDM permite reducir la dimensionalidad de un conjunto de vectores de características relacionadas en el tiempo e inferir posiciones latentes futuras. Asimismo, el correspondiente vector de características puede ser reconstruido dada la posición en el espacio latente. Sin embargo, el aprendizaje de un único modelo genérico para todo tipo de actividades peatonales o la combinación de algunas de ellas en un único modelo produce normalmente estimaciones imprecisas de las observaciones futuras. Por esta razón, el método propuesto aprende múltiples modelos de cada tipo de actividad peatonal, éstas son: andando, parando, comenzando a andar y parado, y selecciona el modelo más apropiado en cada instante de tiempo con el objetivo de estimar los estados futuros de los peatones. El método funciona como sigue: dado un conjunto de entrenamiento compuesto de secuencias de movimientos de peatones, éste es dividido en 8 subconjuntos basándose en la orientación de cruce, ya sea, de izquierda a derecha o de derecha a izquierda, y tipo de actividad. A continuación, se obtiene un B-GPDM por cada secuencia contenida en el conjunto de entrenamiento. Por otro lado, dada una nueva observación de un peatón, su actividad es determinada por medio de un algoritmo de reconocimiento de actividades basado en un Modelo Oculto de Markov. Así, la selección del modelo más adecuado entre todos los entrenados se realiza entre los pertenecientes a esa actividad. Finalmente, el modelo escogido se utiliza para predecir posiciones latentes futuras y, a partir de ahí, reconstruir las trayectorias y las posturas. Los resultados verifican que la información de los hombros y las piernas es más valiosa que la información procedente de otras partes del cuerpo cuando se trata de reconocer la acción del peatón. Concretamente, la mayor exactitud, 95.13%, se logra cuando las observaciones están compuestas de unos pocos puntos situados a lo largo de las piernas y los hombros. Sin embargo, esta exactitud cae hasta el 90.69% si se utilizan un mayor número de puntos localizados a lo largo de todo el cuerpo. El método propuesto en este documento detecta intenciones de comenzar a andar 125 milisegundos después de la iniciación del paso con una exactitud del 80% y reconoce intenciones de parado 58.33 milisegundos antes del evento con una exactitud del 70% cuando se utilizan únicamente puntos de los hombros y las piernas.