Scene understanding for mapping

  1. Salas García, Marta
Dirigida por:
  1. José M. Martínez Montiel Director/a

Universidad de defensa: Universidad de Zaragoza

Fecha de defensa: 13 de enero de 2016

Tribunal:
  1. Yolanda Margarita Celi Vivanco Presidente/a
  2. Ana Cristina Murillo Arnal Secretario/a
  3. Roberto Javier López Sastre Vocal

Tipo: Tesis

Teseo: 401289 DIALNET

Resumen

Para que un robot pueda realizar una tarea en un entorno necesita percibirlo y entenderlo. La construcción de mapas usando una cámara como sensor está basado en puntos 3D, los cuales sirven el propósito de localizar al robot en el entorno, pero al carecer éstos de significado no ayudan a la compresión de la escena. Esta tesis trata de llenar de información semántica estos mapas de puntos, lo que permitiría a \emph{un robot ver}. El primer paso que se tomó para abordar este problema, fue modelar, detectar e insertar instancias de objetos particulares en estos mapas. El resultado de esta investigación da lugar a mapas con una combinación de puntos y objetos. Esto permite saber con precisión la posición de las instancias particulares dentro del entorno en el que el robot tiene que realizar una tarea, permitiéndole interactuar con estos objetos específicos. Para generalizar la tarea de reconocimiento, las instancias de objetos se pueden agrupar en categorías, de tal manera que no se necesite un modelo de cada cama particular para reconocerla. Englobadas todas las instancias en categoría y usando técnicas de \emph{machine learning} se puede, idealmente, clasificar \emph{todas las camas del mundo}. La ventaja de utilizar categorías es el incremento en el número de instancias concretas que se pueden reconocer. Además, el resultado del etiquetado del mapa se vuelve mucho más denso, permitiéndonos niveles más profundos de razonamiento. Por ejemplo, la diferenciación entre espacio libre para navegar o espacio ocupado, según las categorías que se encuentren se puede razonar sobre el tipo de entorno. Finalmente, los entornos de interior están formados por distintas habitaciones, las transiciones entre los distintos habitáculos, por ejemplo, ir de una habitación a otra habitación, pueden provocar oclusiones severas que imposibilite conectar el mapa que se estaba construyendo (el interior de una habitación) con el nuevo entorno que se está explorado. La posibilidad de incorporar información previa sobre las fronteras de una habitación en los mapas ayuda a razonar sobre las transiciones y las posibles oclusiones. Con todo esto, se proporcionan mapas con significado semántico que podrían ser utilizados por un robot para ver el entorno, permitiéndole entenderlo.