Computationally constrained sound event detection in smart cities
- GARCÍA GÓMEZ, JOAQUÍN
- Roberto Gil Pita Director
Universidade de defensa: Universidad de Alcalá
Fecha de defensa: 07 de xuño de 2021
- Alberto González Salvador Presidente/a
- Manuel Rosa Zurera Secretario
- Cosme Llerena Aguilar Vogal
Tipo: Tese
Resumo
Las ciudades inteligentes son lugares en que se tratan de implementar nuevas tecnologías e ideas de manera sostenible e ingeniosa, con el objetivo de conseguir mejoras en una gran variedad de ámbitos, destacando especialmente la consecución de mejoras sociales, crecimiento económico y nuevas oportunidades. En esta tesis se han investigado cuatro aplicaciones que pueden ayudar a mejorar la calidad de vida de las personas y que deberían estar presentes en este tipo de lugares: la detección de situaciones violentas, la detección de presencia de drones, la detección de actividad vocal en audífonos y el análisis de defectos en tuberías. Todas ellas pueden contribuir a resolver problemas relacionados con la seguridad pública, el bienestar, la inclusión social y la gestión de recursos naturales, entre otros. Existen gran variedad de datos presentes en las ciudades que pueden ayudar a desarrollar estas aplicaciones, como señales de audio, vídeo, radar o radiofrecuencia. Las señales acústicas son una valiosa fuente de estudio, ya que proporcionan una gran cantidad de información acerca de los entornos que nos rodean, y por esta razón han sido consideradas en esta tesis. Además, son muchas las ventajas de los micrófonos en comparación con otro tipo de dispositivos como las videocámaras: tienen un tamaño, consumo y precio menores, poseen una tolerancia mayor a condiciones ambientales adversas, y permiten grabar de forma omnidireccional. En esta tesis se han desarrollado técnicas de aprendizaje automático para detectar eventos sonoros en las señales. En todas las aplicaciones se ha implementado un sistema de reconocimiento de patrones que incluye las fases de extracción de características, selección de las mismas y detección. Estos procedimientos se han restringido en cuanto a coste computacional, ya que el número de operaciones que lleva a cabo un microprocesador se encuentra directamente relacionado con el consumo del dispositivo, y se desea desarrollar sistemas que trabajen de forma autónoma en la medida de lo posible. Por esta razón, y dado que generalmente no existen bases de datos extensas en estos campos, se ha evitado el uso de técnicas más complejas como el aprendizaje profundo. A lo largo de la tesis se han obtenido resultados satisfactorios, y se puede por tanto afirmar que es posible aplicar técnicas de detección de eventos acústicos restringidas en términos computacionales a las aplicaciones mencionadas anteriormente, alcanzando un equilibro entre consumo y rendimiento. Además, la aplicación de técnicas de optimización adicionales basadas en detectores en cascada ha demostrado ser útil en un dispositivo final restrictivo, como es el caso de un audífono.