Defensa de tesis 'Protoformas cuantificadas borrosas para sistemas data-to-text: un nuevo modelo con aplicaciones'

Es bien sabido hoy en día que las organizaciones consumen y generan una gran cantidad de datos. Sin embargo, estos datos tienen valor real en la medida que puedan transformarse en información relevante y útil, que pueda trasladarse de forma efectiva para que sea tenida en cuenta en los procesos de toma de decisiones por las personas responsables. En este contexto, aunque ya son muy comunes, las herramientas que permiten comunicar los resultados de esos análisis de datos están todavía en desarrollo. Es ahí donde los sistemas data-to-text (D2T), disciplina que se centra en la generación automática de textos a partir de diversas fuentes de datos numéricos o simbólicos, se presentan como una aproximación emergente de una indudable utilidad. Dentro del área de la Generación de Lenguaje Natural (NLG), los sistemas D2T son capaces de procesar grandes cantidades de datos numéricos, convirtiéndolos en textos que contienen información relevante y comprensible para los usuarios.

Un problema dentro del campo del campo del NLG es que no se modela la semántica de los términos empleados, especialmente de aquellos imprecisos, lo que supone que se pierda naturalidad en los textos generados. Por lo tanto, con el objetivo de manejar esta imprecisión, en el campo de la lógica borrosa surgen diversas propuestas para modelar la semántica de los términos imprecisos, entre los que destacan, por su importancia en la comunicación humana, los cuantificadores lingüísticos borrosos.En esta tesis se han abordado tres objetivos:

  • Extender y mejorar la fase de determinación de contenido en sistemas D2T para representar el conocimiento impreciso y la búsqueda inteligente. Para esto, hemos considerado aproximaciones metaheurísticas con el objetivo de obtener un buen compromiso entre calidad de la solución y coste computacional.
  • Medir y comparar el impacto de la selección del método de cuantificación borrosa para analizar su comportamiento de forma empírica en la evaluación de sentencias cuantificadas borrosas
  • Diseñar un nuevo modelo D2T para describir series temporales de datos, que se ha utilizado con éxito en dos aplicaciones reales de impacto: salud e información medioambiental.
Directores: Alberto Bugarín Diz y Alejandro Ramos Soto