Contributions to keyword spotting and spoken term detection for information retrieval in audio minig

  1. Tejedor Noguerales, Javier
Supervised by:
  1. José Colás Pasamontes Director

Defence university: Universidad Autónoma de Madrid

Fecha de defensa: 14 April 2009

Committee:
  1. Joaquín González Rodríguez Chair
  2. Doroteo Torre Toledano Secretary
  3. Javier Macías Guarasa Committee member
  4. Alastair D. King Committee member
  5. Ascensión Gallardo Antolín Committee member

Type: Thesis

Abstract

En la actualidad, el n'umero de aplicaciones que usan las t'ecnicas basadas en reconocimiento de voz crece de forma imparable. Dentro de tales aplicaciones, la extracci'on de informaci'on en voz es una actividad de reconocida importancia. Las t'ecnicas basadas en voz, como los reconocedores de habla continua, han sido ampliamente usadas para desarrollar tales aplicaciones, por medio de los reconocedores de habla continua de gran vocabulario. Sin embargo, los sistemas de reconocimiento de habla continua de gran vocabulario por sí mismos no son suficientes a la hora de realizar b'usquedas en el contenido de audio por la siguiente raz'on: en la extracci'on de informaci'on en voz, el conjunto de palabras que se suele usar para acceder a la informaci'on almacenada en grandes repositorios de audio incluye nombres propios, acr'onimos, extranjerismos, que no suelen aparecer en el vocabulario de los reconocedores de habla continua de gran vocabulario (es decir, son palabras de fuera del vocabulario). Esto obliga a buscar y desarrollar nuevas t'ecnicas que permitan acceder a dicha informaci'on: el Reconocimiento de Palabras Clave y la Detecci'on de T'erminos Hablados. Estas dos t'ecnicas intentan solucionar el problema causado por las palabras fuera de vocabulario dentro de los sistemas de extracci'on de informaci'on en voz. Esta tesis est'a enfocada al desarrollo de nuevos m'etodos y soluciones que son aplicados para el Reconocimiento de Palabras Clave y la Detecci'on de T'erminos Hablados