ESTUDIO DE LA SÍNTESIS DE VOZ Y SU APLICACIÓN AL SOFTWARE EDUCATIVO Autor: Felipe Fernández...
-
Upload
reina-balli -
Category
Documents
-
view
0 -
download
0
Transcript of ESTUDIO DE LA SÍNTESIS DE VOZ Y SU APLICACIÓN AL SOFTWARE EDUCATIVO Autor: Felipe Fernández...
ESTUDIO DE LA SÍNTESIS DE VOZ Y SU APLICACIÓN AL SOFTWARE
EDUCATIVO
Autor: Felipe Fernández DomínguezTutores: Miguel Ángel Laguna SerranoBruno González Baixauli
Índice
Objetivos Software educativo Síntesis de voz Interfaces animadas Desarrollo de la aplicación Conclusiones
Objetivos
Comprender el proceso de síntesis de voz desde un punto de vista teórico y los sintetizadores disponibles.
Estudio en profundidad de las interfaces animadas, centrándonos en Microsoft Agent.
Realización de una aplicación que sirva como introducción al mundo del PC para niños de educación primaria.
Índice
Objetivos Software educativo Síntesis de voz Interfaces animadas Desarrollo de la aplicación Conclusiones
Software educativo
Diferentes enfoques dependiendo del alumno al que vaya dirigido
– Educación infantil: estimulación sensorial y conocimiento del entorno
– Educación primaria: basado en el desarrollo de capacidades como memoria, concentración, razonamiento lógico
– Educación especial: Proyecto Fressa
Proyecto Fressa
Índice
Objetivos Software educativo Síntesis de voz Interfaces animadas Desarrollo de la aplicación Conclusiones
Síntesis de voz
Visión teórica Alternativas disponibles
Visión teórica
Front-end– Toma como entrada un texto y produce una
representación lingüística fonética– Normalizacion de texto o preprocesado– Texto a fonema
Back-end– Toma como entrada la representación lingüística
y produce una forma de onda sintetizada
Síntesis de voz
Visión teórica Alternativas disponibles
Alternativas disponibles
Festival Flite FreeTTS MBROLA
Festival
El proyecto de Festival comenzó en 1994 en el centro de tecnologías del habla de la universidad de Edimburgo.
Festival esta diseñado para permitir añadir nuevos módulos, fácil y eficientemente, sin que el desarrollador tenga que recorrer camino ya andado
Flite
Flite fue diseñado como una alternativa a Festival que mejorara cuestiones claves para su uso en dispositivos móviles.
Mejor portabilidad, tamaño y velocidad, al estar escrito completamente en C(no en C++ o Scheme)
FreeTTS
Supera los problemas de Flite de dependencia con las plataformas y sus compiladores.
Reescrito totalmente en Java, mantiene la arquitectura de Flite.
MBROLA
El proyecto MBROLA tiene un sintetizador de voz basado en la concatenación de difonos.
Una de las bases de datos de difonos disponibles en español fue desarrollada por profesores de la UVA.
Índice
Objetivos Software educativo Síntesis de voz Interfaces animadas Desarrollo de la aplicación Conclusiones
Interfaces de Usuario con personajes animados
– Los agentes animados con interfaces conversacionales proporcionan un paradigma intuitivo de interacción ya que el usuario no necesita adquirir nuevos conocimientos.
– Los usuarios encuentran estos sistemas más amigables y cooperativos.
Características de Microsoft Agent
Está disponible en la red para descargarlo gratuitamente y puede ser empleado por los desarrolladores en sus aplicaciones sin coste de derechos de autor.
Características de Microsoft Agent
La interfaz de programación de aplicación (API) de Microsoft Agent proporciona servicios de programación entre los que destacan: la habilidad de cargar un personaje, ejecutar una animación, hablar usando un sintetizador de voz y aceptar entrada de voz del usuario.
Índice
Objetivos Software educativo Síntesis de voz Interfaces animadas Desarrollo de la aplicación Conclusiones
Desarrollo de la aplicación
Análisis del sistema. Definición del Análisis del sistema. Definición del problemaproblema
Diseño Implementación Pruebas
Resultados de las entrevistas
Los entrevistados fueron estudiantes de la facultad de Magisterio y monitores de ocio y tiempo libre.
Necesidad de una aplicación amena e intuitiva.
Diagrama general de casos de uso
Diagrama inicial de clases
Jugar cuento
Jugar imágenes
Desarrollo de la aplicación
Análisis del sistema. Definición del problema Diseño Diseño Implementación Pruebas
Diagrama de clases final
Jugar ingles
Demostración de gestos
Desarrollo de la aplicación
Análisis del sistema. Definición del problema Diseño Implementación Pruebas
Implementación
Entorno de desarrollo: Microsoft Visual Studio.Net
Lenguaje de programación:C# Paquete de servicios:Microsoft Agent 2.0
Microsoft Agent 2.0
Character.Show(null); Character.MoveTo(50,50,null); Character.Speak("Hola buenas tardes",null ); Character.Hide(5);
Desarrollo de la aplicación
Análisis del sistema. Definición del problema Diseño Implementación Pruebas
Pruebas
Índice
Objetivos Software educativo Síntesis de voz Interfaces animadas Desarrollo de la aplicación Conclusiones
Dificultades encontradas
Las opciones disponibles en síntesis de voz no son tantas.
Si encima añades idioma español,bajo Windows y libre las dificultades son mayores.
La portabilidad de sistemas desarrollados en Linux a Windows no es trivial.
Posibles mejoras
Reconocimiento del habla Desarrollo en aplicaciones web Introducción de nuevo elementos.