Generación automática de descripciones lingüísticas de datos en meteorología usando metaheurísticas

En este trabajo se presenta un sistema de generación de descripciones lingüísticas en tiempo real sobre datos de observación meteorológica proporcionados por la Agencia Meteorológica gallega (MeteoGalicia). Utilizando protoformas de Zadeh, el sistema genera sentencias cuantificadas borrosas de tipo I y tipo II, que incluyen referencias geográficas imprecisas y resultan válidas como mecanismo explicable en un sistema machine learning descriptivo o para la etapa de determinación de contenidos de un sistema de Generación de Lenguaje Natural. La generación de las descripciones va guiada por una metaheurística que permite seleccionar las descripciones lingüísticas más adecuadas de acuerdo con un conjunto de criterios que tiene en cuenta, el grado de cumplimiento de las descripciones, la cobertura de datos y la longitud de las descripciones, evitando así la explosión combinatoria que se produce en el proceso de generación en cuanto al número de posibles descripciones consistentes con los datos.

Palabras clave: data-to-text, determinación de contenidos, metaheurísticas, generación de lenguaje natural