NaturTtSMLUn esquema de anotación para la mejora de la naturalidad en los sistemas de síntesis de voz

  1. Albert González Lamaña 1
  2. Antonio Pareja Lora 2
  1. 1 Universidad Nacional de Educación a Distancia
    info

    Universidad Nacional de Educación a Distancia

    Madrid, España

    ROR https://ror.org/02msb5n36

  2. 2 Universidad Complutense de Madrid
    info

    Universidad Complutense de Madrid

    Madrid, España

    ROR 02p0gd045

Zeitschrift:
E-Aesla

ISSN: 2444-197X

Datum der Publikation: 2018

Nummer: 4

Seiten: 375-390

Art: Artikel

Andere Publikationen in: E-Aesla

Zusammenfassung

Aunque el resultado de los sistemas de conversión de texto a voz (CTV) actuales suele ser bastante inteligible, un CTV produce habitualmente una lectura monótona. Una de las principales causas de este problema es que un CTV no puede interpretar el contenido de un texto plano. Por lo tanto, para conseguir una lectura más expresiva y natural es necesario indicarle cómo debe leer el texto. Existen varios lenguajes y esquemas de anotación para este fin, pero parciales y/o centrados en diferentes aspectos del habla expresiva. Este artículo presenta un esquema de anotación (NaturTtSML) que reúne en uno solo los elementos principales de todos ellos.