New advances in cross-task and speaker adaptation for air traffic control tasks

  1. Córdoba, Ricardo de
  2. Macías Guarasa, Javier
  3. Sama Rojo, Valentín
  4. Barra, Roberto
  5. Pardo, José Manuel
Revista:
Procesamiento del lenguaje natural

ISSN: 1135-5948

Año de publicación: 2005

Número: 35

Páginas: 21-27

Tipo: Artículo

Otras publicaciones en: Procesamiento del lenguaje natural

Resumen

En este artículo exploramos diversas opciones para la adaptación a tarea en reconocimiento de habla y las comparamos con desarrollar el sistema nuevo desde cero. Comparamos adaptación a tarea mediante MAP y MLLR, y ambas en serie, en dos reconocedores de habla para tareas de control del tráfico aéreo, una para habla espontánea y la otra para una interfaz de comandos. Vamos a mostrar cómo MLLR puede incluso superar a MAP cuando se utilizan un número elevado de transformadas, cómo MLLR seguido de MAP es la mejor opción, y también vamos a proporcionar varias pistas de cuáles son las mejores opciones para la creación de los árboles de clases de regresión utilizados en MLLR. En todos los casos, demostramos la efectividad de la adaptación conjunta de medias y varianzas. Para la interfaz de comandos, también incluimos la comparación entre MAP y MLLR para adaptación a locutor utilizando una cantidad variable de datos de adaptación