Análisis Afijal como marcador de atribución de autoría
Transcript of Análisis Afijal como marcador de atribución de autoría
![Page 1: Análisis Afijal como marcador de atribución de autoría](https://reader035.fdocuments.us/reader035/viewer/2022062901/62b97618b29c8768095ff1b1/html5/thumbnails/1.jpg)
Análisis Afijal como marcador de atribución
de autoría
Dr. Alfonso Medina Urrea Dra. Fernanda López Escobedo
Ariana Paz Ramos
Grupo de Ingeniería Lingüística Instituto de Ingeniería, UNAM, México.
![Page 2: Análisis Afijal como marcador de atribución de autoría](https://reader035.fdocuments.us/reader035/viewer/2022062901/62b97618b29c8768095ff1b1/html5/thumbnails/2.jpg)
Atribución de Autoría
• Tarea principal: Identificar un autor
Function Words
Vocabulary analysis
N-grams
Syntactic Features
Multivariate techniques
![Page 3: Análisis Afijal como marcador de atribución de autoría](https://reader035.fdocuments.us/reader035/viewer/2022062901/62b97618b29c8768095ff1b1/html5/thumbnails/3.jpg)
Objetivos de la investigación
• a) Analizar cómo se agrupan los textos de los 29 autores del corpus en las gráficas, dependiendo del grado y área de estudio.
• b) Observar si textos del mismo autor se agrupan.
• c) analizar el comportamiento de los diferentes géneros textuales: argumentativo, emotivo, ficción.
![Page 4: Análisis Afijal como marcador de atribución de autoría](https://reader035.fdocuments.us/reader035/viewer/2022062901/62b97618b29c8768095ff1b1/html5/thumbnails/4.jpg)
Hipótesis iniciales
• Durante el proceso de escritura se toman decisiones que no son totalmente conscientes.
• Si el uso de los afijos cuando se escribe es primordialmente una decisión inconsciente, entonces el análisis morfológico puede ser útil para perfilar el estilo de escritura de un autor.
• “Huella autoral”
![Page 5: Análisis Afijal como marcador de atribución de autoría](https://reader035.fdocuments.us/reader035/viewer/2022062901/62b97618b29c8768095ff1b1/html5/thumbnails/5.jpg)
Corpus
• Conformado por textos escritos por 29 autores .
• Palabras por texto: aproximadamente 590 .
• Cada autor escribió tres textos en tres géneros distintos: emotivo, argumentativo y ficción. El conjunto de estos textos pretende ser una muestra representativa de cada autor.
• 87 textos en total.
![Page 6: Análisis Afijal como marcador de atribución de autoría](https://reader035.fdocuments.us/reader035/viewer/2022062901/62b97618b29c8768095ff1b1/html5/thumbnails/6.jpg)
Procedimiento
• El autor escribe tres textos en géneros distintos.
Escritura
• Los textos son convertidos a .txt
archivos .txt • Una
nomenclatura es asignada a cada texto.
Clasificación
![Page 7: Análisis Afijal como marcador de atribución de autoría](https://reader035.fdocuments.us/reader035/viewer/2022062901/62b97618b29c8768095ff1b1/html5/thumbnails/7.jpg)
•Cada texto es procesado individualmente.
•Los textos escritos por el mismo autor se agrupan en un archivo para un análisis.
Extracción de Afijos
•Del paso anterior se obtiene un catálogo de afijos.
•Se constuyen diferentes matrices para comparar los datos.
Perfil Morfológico •La distancia euclideana (DE) se
usa para medir la distancia (semejanza/diferencia) entre textos
•Los resultados de la DE son representados mediante escalamiento multidimensional.
Análisis
Procedimiento II
![Page 8: Análisis Afijal como marcador de atribución de autoría](https://reader035.fdocuments.us/reader035/viewer/2022062901/62b97618b29c8768095ff1b1/html5/thumbnails/8.jpg)
Extractor Morfológico (Medina 2009)
EL archivo .txt es analizado
Los valores de entropía son calculados (Shannon 1949)
Las palabras se segmentan gráficamente
Se genera automáticamente un catálogo de afijos
![Page 9: Análisis Afijal como marcador de atribución de autoría](https://reader035.fdocuments.us/reader035/viewer/2022062901/62b97618b29c8768095ff1b1/html5/thumbnails/9.jpg)
Entropía
• Criterio para determinar la probabilidad de que un segmento dado sea un afijo.
• Óptimo para análisis de corpus pequeños.
• La entropía se calcula para cada texto.
• Método no supervisado
![Page 10: Análisis Afijal como marcador de atribución de autoría](https://reader035.fdocuments.us/reader035/viewer/2022062901/62b97618b29c8768095ff1b1/html5/thumbnails/10.jpg)
![Page 11: Análisis Afijal como marcador de atribución de autoría](https://reader035.fdocuments.us/reader035/viewer/2022062901/62b97618b29c8768095ff1b1/html5/thumbnails/11.jpg)
![Page 12: Análisis Afijal como marcador de atribución de autoría](https://reader035.fdocuments.us/reader035/viewer/2022062901/62b97618b29c8768095ff1b1/html5/thumbnails/12.jpg)
Perfil Morfológico
• ¿Qué es un catálogo de afijos?
El resultado de la extracción de segmentos cuya probabilidad de ser un afijo es alta.
Estos afijos no son siempre lingüísticos
El catálogo muestra los afijos que están en un texto determinado y su frecuencia de aparición.
![Page 13: Análisis Afijal como marcador de atribución de autoría](https://reader035.fdocuments.us/reader035/viewer/2022062901/62b97618b29c8768095ff1b1/html5/thumbnails/13.jpg)
Matrices 1. Todos los textos de todos los géneros y todos los autores.
2. Todos los textos escritos por estudiantes de ciencias.
3. Todos los textos escritos por estudiantes de Humanidades.
4. Todos los textos escritos por estudiantes de posgrado.
5. Todos los textos escritos por estudiantes de licenciatura.
6. Textos concatenados escritos por todos los autores.
7. Textos concatenados escritos por estudiantes de humanidades.
8. Textos concatenados escritos por estudiantes de ciencias.
9. Textos concatenados escritos por estudiantes de posgrado.
10. Textos concatenados escritos por estudiantes de licenciatura.
![Page 14: Análisis Afijal como marcador de atribución de autoría](https://reader035.fdocuments.us/reader035/viewer/2022062901/62b97618b29c8768095ff1b1/html5/thumbnails/14.jpg)
Matriz todos los autores/ todos los géneros
![Page 15: Análisis Afijal como marcador de atribución de autoría](https://reader035.fdocuments.us/reader035/viewer/2022062901/62b97618b29c8768095ff1b1/html5/thumbnails/15.jpg)
Resultados
![Page 16: Análisis Afijal como marcador de atribución de autoría](https://reader035.fdocuments.us/reader035/viewer/2022062901/62b97618b29c8768095ff1b1/html5/thumbnails/16.jpg)
• Los textos no se agrupan por área o nivel de estudio.
• En las gráficas no se muestra una tendencia que marque diferencias entre estudiantes de humanidades y de ciencias.
![Page 17: Análisis Afijal como marcador de atribución de autoría](https://reader035.fdocuments.us/reader035/viewer/2022062901/62b97618b29c8768095ff1b1/html5/thumbnails/17.jpg)
Todos los textos de todos los autores
![Page 18: Análisis Afijal como marcador de atribución de autoría](https://reader035.fdocuments.us/reader035/viewer/2022062901/62b97618b29c8768095ff1b1/html5/thumbnails/18.jpg)
Todos los textos estudiantes de ciencias
![Page 19: Análisis Afijal como marcador de atribución de autoría](https://reader035.fdocuments.us/reader035/viewer/2022062901/62b97618b29c8768095ff1b1/html5/thumbnails/19.jpg)
Todos los textos de estudiantes de humanidades
![Page 20: Análisis Afijal como marcador de atribución de autoría](https://reader035.fdocuments.us/reader035/viewer/2022062901/62b97618b29c8768095ff1b1/html5/thumbnails/20.jpg)
• Textos del mismo género se agrupan en determinadas áreas.
• Los textos de género argumentativo ocupan sólo una sección en la gráfica mientras que los textos emotivos y de ficción se dispersan en toda la gráfica.
![Page 21: Análisis Afijal como marcador de atribución de autoría](https://reader035.fdocuments.us/reader035/viewer/2022062901/62b97618b29c8768095ff1b1/html5/thumbnails/21.jpg)
![Page 22: Análisis Afijal como marcador de atribución de autoría](https://reader035.fdocuments.us/reader035/viewer/2022062901/62b97618b29c8768095ff1b1/html5/thumbnails/22.jpg)
Conclusiones y trabajo futuro
Sería apresurado descartar la viabilidad del análisis morfológico en el campo de atribución de autoría.
• Aunque este tipo de análisis morfológico no pudo discernir entre áreas de conocimiento y niveles de educación, sí separa entre géneros literarios.
• Nuevas matrices pueden ser elaboradas para encontrar otras relaciones entre los textos.
• La distancia entre los textos puede ser medida por otros métodos.
• El análisis morfológico puede mostrar más hábitos lingüísticos en textos más largos.
![Page 23: Análisis Afijal como marcador de atribución de autoría](https://reader035.fdocuments.us/reader035/viewer/2022062901/62b97618b29c8768095ff1b1/html5/thumbnails/23.jpg)
• Experimentos con lenguajes con rica morfología (Griego, Hebreo, Ruso), pueden arrojar niveles altos de entropía, incluso analizando textos pequeños.
• Textos nuevos de los autores pueden ser analizados diacrónicamente por este método morfológico.
![Page 24: Análisis Afijal como marcador de atribución de autoría](https://reader035.fdocuments.us/reader035/viewer/2022062901/62b97618b29c8768095ff1b1/html5/thumbnails/24.jpg)
FIN