Conferencia: 'Algunas cuestiones sobre el procesamiento de la narrativa financiera en español'

El Procesamiento de la Narrativa Financiera (FNP en inglés) es un campo de estudio multidisciplinar que reúne a expertos en finanzas, comunicación, lingüística e inteligencia artificial. El objetivo es analizar las estrategias de comunicación que utilizan los directivos de las empresas con sus inversores. Expertos en lingüística de corpus y en PLN han aplicado sus técnicas (extracción de información, resumen automático, clasificación de documentos y análisis de sentimientos) a los textos financieros, obteniendo interesantes resultados del procesamiento masivo de textos. Hasta hace poco, el FNP se limitaba a documentos en inglés, el idioma internacional de las finanzas. En los últimos años, el francés, el español, el portugués, el chino y el japonés, entre otros, han recibido tratamiento computacional en este ámbito.

En esta comunicación, presentaré los principales resultados de los proyectos FinT-esp y CLARA-Fin, dedicados íntegramente a la narrativa financiera en español. En primer lugar, trataré el corpus compilado de informes anuales y cartas de presidentes a accionistas (Moreno et al 2020). Consta de más de 400 documentos y 25 millones de palabras. Luego, mostraré algunos estudios lingüísticos sobre el uso de metáforas (Vargas & Moreno, 2021), términos y anglicismos (Vargas & Carbajo, 2021) y marcadores del discurso (García Toro & Moreno, 2021). Añadiré dos experimentos computacionales: el análisis de sentimientos y la clasificación de empresas con pérdidas y ganancias.

Terminaré con una prospectiva sobre nuestros próximos desarrollos en este campo, destinados a resumir y simplificar el contenido técnico de los textos financieros.

Sobre el ponente

Antonio Moreno-Sandoval (antonio.msandoval@uam.es) es Catedrático de Lingüística, Director del Laboratorio de Lingüística Informática de la UAM y Director de la Cátedra UAM-IIC de Lingüística Computacional. Fue becario postdoctoral Fulbright en el Departamento de Informática de la Universidad de Nueva York (1991-1992) en el equipo del Prof. R. Grishman, y becario postdoctoral del DAAD en la Universidad de Augsburgo (1998). Su formación en Lingüística Computacional comenzó como ayudante de investigación en el Proyecto Eurotra de Traducción Automática (FP-2 de la UE) y luego en el Centro Científico de IBM en Madrid (1989-1990). Fue el investigador principal del equipo español en el proyecto C-ORAL-ROM (FP-5 de la UE). Desde 2010 es investigador senior en el Instituto de Ingeniería del Conocimiento (IIC-UAM) dentro del grupo de Social Business Analytics. Desde 2018 es también Director de la Cátedra UAM-IIC de Lingüística Computacional. Moreno-Sandoval ha dirigido 14 tesis hasta la fecha. Es autor o coautor de 6 libros, entre ellos Lingüística Computacional (1998), Gramáticas de unificación y rasgos (2001), Lenguas y computación (2019), y Financial Narrative Processing in Spanish (2021), y de más de 100 comunicaciones y artículos científicos. Moreno-Sandoval ha dirigido como IP 1 proyecto europeo, 6 proyectos nacionales, 2 proyectos regionales, y 15 contratos de transferencia de I+D.