Brevísima Introducción a la Lingüística Computacional, Sistemas ...
Transcript of Brevísima Introducción a la Lingüística Computacional, Sistemas ...
Brevísima Introducción a la LingüísticaComputacional, Sistemas Conversacionales y
Diálogo No-Cooperativo
Brian Plüss
Centre for Research in ComputingThe Open Univerisity
Milton Keynes, UK
DCC - FCEIA - UNRRosario, 1 de abril de 2011
Brian Plüss (OU) Introducción a la Lingüística Computacional 1 de abril de 2011 1 / 17
Lingüística ComputacionalDe Wikipedia:“Un área de estudio interdisciplinaria que trata con el modeladoestadístico y/o basado en reglas del lenguaje natural desde unaperspectiva computacional.”
Lingüística
+
Cs. de la Computación
Beneficios mutuos:=⇒ Ideas de la lingüística llevan a mejores modelos computacionales yherramientas
⇐= Modelos computacionales proveen un “banco de prueba” parateorías lingüísticas
Brian Plüss (OU) Introducción a la Lingüística Computacional 1 de abril de 2011 2 / 17
Lingüística ComputacionalDe Wikipedia:“Un área de estudio interdisciplinaria que trata con el modeladoestadístico y/o basado en reglas del lenguaje natural desde unaperspectiva computacional.”
Lingüística
+
Cs. de la Computación
Beneficios mutuos:=⇒ Ideas de la lingüística llevan a mejores modelos computacionales yherramientas
⇐= Modelos computacionales proveen un “banco de prueba” parateorías lingüísticas
Brian Plüss (OU) Introducción a la Lingüística Computacional 1 de abril de 2011 2 / 17
Lingüística ComputacionalDe Wikipedia:“Un área de estudio interdisciplinaria que trata con el modeladoestadístico y/o basado en reglas del lenguaje natural desde unaperspectiva computacional.”
Lingüística
+
Cs. de la Computación
Beneficios mutuos:=⇒ Ideas de la lingüística llevan a mejores modelos computacionales yherramientas
⇐= Modelos computacionales proveen un “banco de prueba” parateorías lingüísticas
Brian Plüss (OU) Introducción a la Lingüística Computacional 1 de abril de 2011 2 / 17
Lingüística ComputacionalDe Wikipedia:“Un área de estudio interdisciplinaria que trata con el modeladoestadístico y/o basado en reglas del lenguaje natural desde unaperspectiva computacional.”
Lingüística
+
Cs. de la Computación
Beneficios mutuos:=⇒ Ideas de la lingüística llevan a mejores modelos computacionales yherramientas
⇐= Modelos computacionales proveen un “banco de prueba” parateorías lingüísticas
Brian Plüss (OU) Introducción a la Lingüística Computacional 1 de abril de 2011 2 / 17
Lingüística Computacional
Lingüística ≈ Fonología+ Morfología+ Sintaxis+ Semántica+ Pragmática
Cada una con su correspondiente versión computacional
Brian Plüss (OU) Introducción a la Lingüística Computacional 1 de abril de 2011 3 / 17
Fonología
Estudia los sonidos de una lengua.Ejemplos:
el sonido de la ñ pertenece al castellano, pero el de la ã portuguesa no
scr es una secuencia válida de sonidos en castellano (escribir), pero nct no (aunque sí lo esen inglés: sanction)
Aplicaciones:
Reconocimiento automático del habla (ASR)Sintetizadores de voz (TTS)
I Generalmente basados en modelos estadísticos y machine learning
←→ hola
Brian Plüss (OU) Introducción a la Lingüística Computacional 1 de abril de 2011 4 / 17
Fonología
Estudia los sonidos de una lengua.Ejemplos:
el sonido de la ñ pertenece al castellano, pero el de la ã portuguesa no
scr es una secuencia válida de sonidos en castellano (escribir), pero nct no (aunque sí lo esen inglés: sanction)
Aplicaciones:
Reconocimiento automático del habla (ASR)Sintetizadores de voz (TTS)
I Generalmente basados en modelos estadísticos y machine learning
←→ hola
Brian Plüss (OU) Introducción a la Lingüística Computacional 1 de abril de 2011 4 / 17
MorfologíaEstudia la forma, composición y derivación de las palabras.
raíces, prefijos, sufijos, regularidad de los verbos, género y número, etc.
Ejemplos:
estudiaba se obtiene del verbo estudiar por conjugación
biotecnología se obtiene por anteposición del prefijo bio-.
Aplicaciones:
Lematización
Corrección ortográfica (palabras cercanas/afines)Análisis y generación de texto: e.g., tiempo de sucesos, pronombres
Brian Plüss (OU) Introducción a la Lingüística Computacional 1 de abril de 2011 5 / 17
MorfologíaEstudia la forma, composición y derivación de las palabras.
raíces, prefijos, sufijos, regularidad de los verbos, género y número, etc.
Ejemplos:
estudiaba se obtiene del verbo estudiar por conjugación
biotecnología se obtiene por anteposición del prefijo bio-.
Aplicaciones:
Lematización
Corrección ortográfica (palabras cercanas/afines)Análisis y generación de texto: e.g., tiempo de sucesos, pronombres
Brian Plüss (OU) Introducción a la Lingüística Computacional 1 de abril de 2011 5 / 17
Sintaxis
Estudia las formas en que se combinan las palabras para formarestructuras más complejas.
gramáticas, función de una palabra, Chomsky
Aplicaciones:
Análisis sintáctico (parsing)Etiquetado gramatical (POS tagging)Generación automática de textoTraducción automática
Brian Plüss (OU) Introducción a la Lingüística Computacional 1 de abril de 2011 6 / 17
Sintaxis
Estudia las formas en que se combinan las palabras para formarestructuras más complejas.
gramáticas, función de una palabra, Chomsky
Aplicaciones:
Análisis sintáctico (parsing)Etiquetado gramatical (POS tagging)Generación automática de textoTraducción automática
Brian Plüss (OU) Introducción a la Lingüística Computacional 1 de abril de 2011 6 / 17
SemánticaEstudia el significado, sentido o interpretación de las palabras.
lexicografía, sinonimia, diccionarios, acepciones, representación lógica, Montague
Aplicaciones:Extracción de información (e.g., web→ semantic web)Generación automática de resúmenes (tópico y relevancia)Google AdSense /Coherencia (parcial - e.g., resolución de pronombres y artículos)
Brian Plüss (OU) Introducción a la Lingüística Computacional 1 de abril de 2011 7 / 17
SemánticaEstudia el significado, sentido o interpretación de las palabras.
lexicografía, sinonimia, diccionarios, acepciones, representación lógica, Montague
Aplicaciones:Extracción de información (e.g., web→ semantic web)Generación automática de resúmenes (tópico y relevancia)Google AdSense /Coherencia (parcial - e.g., resolución de pronombres y artículos)
Brian Plüss (OU) Introducción a la Lingüística Computacional 1 de abril de 2011 7 / 17
PragmáticaEstudia los significados en contexto y el lenguaje en uso.
ambigüedad, relevancia, consistencia, inferencia, interacción, historiasentido común, conocimiento del mundo, psicología, conocimientocompartido, relaciones interpersonales, sociología,. . .
Ejemplos:
“Iba en el auto llegando a la esquina y se me cruzó un perro.”
“¡Qué perro! El gol que erró.”
⇒ El caso de la Teoría de la Relevancia
Aplicaciones:
Análisis y generación de narrativaHumor computacionalResumen de reunionesSistemas de diálogoAgentes conversacionales
Brian Plüss (OU) Introducción a la Lingüística Computacional 1 de abril de 2011 8 / 17
PragmáticaEstudia los significados en contexto y el lenguaje en uso.
ambigüedad, relevancia, consistencia, inferencia, interacción, historiasentido común, conocimiento del mundo, psicología, conocimientocompartido, relaciones interpersonales, sociología,. . .
Ejemplos:
“Iba en el auto llegando a la esquina y se me cruzó un perro.”
“¡Qué perro! El gol que erró.”
⇒ El caso de la Teoría de la Relevancia
Aplicaciones:
Análisis y generación de narrativaHumor computacionalResumen de reunionesSistemas de diálogoAgentes conversacionales
Brian Plüss (OU) Introducción a la Lingüística Computacional 1 de abril de 2011 8 / 17
PragmáticaEstudia los significados en contexto y el lenguaje en uso.
ambigüedad, relevancia, consistencia, inferencia, interacción, historiasentido común, conocimiento del mundo, psicología, conocimientocompartido, relaciones interpersonales, sociología,. . .
Ejemplos:
“Iba en el auto llegando a la esquina y se me cruzó un perro.”
“¡Qué perro! El gol que erró.”
⇒ El caso de la Teoría de la Relevancia
Aplicaciones:
Análisis y generación de narrativaHumor computacionalResumen de reunionesSistemas de diálogoAgentes conversacionales
Brian Plüss (OU) Introducción a la Lingüística Computacional 1 de abril de 2011 8 / 17
Sistemas de Diálogo y Agentes ConversacionalesAplicaciones con las cuales se interactúa principalmente a través del habla.
Brian Plüss (OU) Introducción a la Lingüística Computacional 1 de abril de 2011 9 / 17
Sistemas de Diálogo y Agentes ConversacionalesAplicaciones con las cuales se interactúa principalmente a través del habla.
Brian Plüss (OU) Introducción a la Lingüística Computacional 1 de abril de 2011 10 / 17
Sistemas de Diálogo y Agentes ConversacionalesAplicaciones con las cuales se interactúa principalmente a través del habla.
Brian Plüss (OU) Introducción a la Lingüística Computacional 1 de abril de 2011 11 / 17
Sistemas de Diálogo y Agentes Conversacionales
Arquitectura y ciclo típicos:
habla ⇓
Reconocedor de Voz
texto ⇓
AnalizadorSintáctico/Semántico
semántica ⇓
habla ⇑
Sintetizador de Voz
texto ⇑
Generador de LenguajeNatural
semántica ⇑
Gestor de Diálogo
Brian Plüss (OU) Introducción a la Lingüística Computacional 1 de abril de 2011 12 / 17
Gestor de Diálogo
El el núcleo de un sistema de diálogos
Controla la dinámica de la conversaciónMantiene las estructuras de información necesarias
I Historia de diálogoI Elementos del dominioI Plan de tareasI Objetivos
Implementa una teoría de diálogoI IntencionesI Planes compartidosI Tópico de discusiónI Obligaciones y compromisos
Brian Plüss (OU) Introducción a la Lingüística Computacional 1 de abril de 2011 13 / 17
Gestor de Diálogo
El el núcleo de un sistema de diálogos
Controla la dinámica de la conversaciónMantiene las estructuras de información necesarias
I Historia de diálogoI Elementos del dominioI Plan de tareasI Objetivos
Implementa una teoría de diálogoI IntencionesI Planes compartidosI Tópico de discusiónI Obligaciones y compromisos
Brian Plüss (OU) Introducción a la Lingüística Computacional 1 de abril de 2011 13 / 17
Gestor de Diálogo
El el núcleo de un sistema de diálogos
Controla la dinámica de la conversaciónMantiene las estructuras de información necesarias
I Historia de diálogoI Elementos del dominioI Plan de tareasI Objetivos
Implementa una teoría de diálogoI IntencionesI Planes compartidosI Tópico de discusiónI Obligaciones y compromisos
Brian Plüss (OU) Introducción a la Lingüística Computacional 1 de abril de 2011 13 / 17
Diálogo No-Cooperativo
Las teorías y modelos de diálogo existentes asumen totalcooperación entre las partes
I IntencionesI Planes compartidosI Tópico de discusiónI Obligaciones y compromisos
En muchos casos esto no se cumple:I NegociacionesI InterrogatoriosI Entrevistas políticasI Exámenes
Ejemplo:I A: ¿Qué piensa hacer para reducir la pobreza?I B: Tenemos que construir hacia adelante y acabar con esta polarización de
la política.
Brian Plüss (OU) Introducción a la Lingüística Computacional 1 de abril de 2011 14 / 17
Diálogo No-Cooperativo
Las teorías y modelos de diálogo existentes asumen totalcooperación entre las partes
I IntencionesI Planes compartidosI Tópico de discusiónI Obligaciones y compromisos
En muchos casos esto no se cumple:I NegociacionesI InterrogatoriosI Entrevistas políticasI Exámenes
Ejemplo:I A: ¿Qué piensa hacer para reducir la pobreza?I B: Tenemos que construir hacia adelante y acabar con esta polarización de
la política.
Brian Plüss (OU) Introducción a la Lingüística Computacional 1 de abril de 2011 14 / 17
Diálogo No-CooperativoEnfoque:
El diálogo como un juego: reglas, estados y metasPartiendo de la teoría de obligaciones y compromisosEn cada contribución, el gestor de diálogo puede decidir entre cumplircon las obligaciones (seguir las reglas del juego) o favorecer sus metas(comportamiento no-cooperativo)Distintos grados de cooperación usando prioridades dinámicas
Metodología:
0. Estudio empírico1. Hipótesis2. Modelado3. Implementación y simulación4. Evaluación5. GOTO 1
Brian Plüss (OU) Introducción a la Lingüística Computacional 1 de abril de 2011 15 / 17
Diálogo No-CooperativoEnfoque:
El diálogo como un juego: reglas, estados y metasPartiendo de la teoría de obligaciones y compromisosEn cada contribución, el gestor de diálogo puede decidir entre cumplircon las obligaciones (seguir las reglas del juego) o favorecer sus metas(comportamiento no-cooperativo)Distintos grados de cooperación usando prioridades dinámicas
Metodología:
0. Estudio empírico1. Hipótesis2. Modelado3. Implementación y simulación4. Evaluación5. GOTO 1
Brian Plüss (OU) Introducción a la Lingüística Computacional 1 de abril de 2011 15 / 17
Lingüística Computacional y LCC
Algunos proyectos con gente de la carrera:
Humor ComputacionalI Pablo Racca
Z2NL: verbalización de casos de prueba en ZI Maxi Cristiá y Federico Moya
Corrector ortográfico basado en reglasI Pomponio, Soriano, Racca, Vanzetto, Cravero, Audano, De Croce
. . .
Brian Plüss (OU) Introducción a la Lingüística Computacional 1 de abril de 2011 16 / 17
¡Gracias!
¿Preguntas?
Brian Plüss (OU) Introducción a la Lingüística Computacional 1 de abril de 2011 17 / 17