Multi3Generation: Generación de Lenguaje Natural multitarea, multilenguaje y multimodal

La generación de lenguaje (LG) es una tecnología crucial para que las máquinas puedan llegar a comunicarse con los humanos de forma continua y coherente por medio del lenguaje. Un gran número de las tareas relacionadas con el Procesado de Lenguaje Natural (NLP) están relacionadas con su generación y con el desarrollo efectivo de tareas que implican que (1) las máquinas estén equipadas con conocimiento del mundo que puede requerir procesado y razonamiento multimodal (e.g. textual, entradas visuales y auditivas, o flujos de datos sensoriales), y (2) el estudio de métodos fuertes y novedosos de Machine Learning (e.g., predicciones estructuradas, modelos generativos), ya que prácticamente el 100% de los modelos estado del arte de NLP se aprenden de los datos. Además, los lenguajes humanos difieren tremendamente en su “realización superficial” (i.e., scripts) así como en su estructura interna (i.e. gramática), lo cual sugiere que la multilingualidad es un objetivo central para que las máquinas realicen generación de lenguaje según las expectativas humanas. Las tecnologías de generación de lenguaje beneficiarán ampliamente tanto los servicios públicos como los privados que se ofrecen a los ciudadanos europeos en una Europa multilingüe, y tienen un fuerte impacto económico y social.

Enlace a la página web del proyecto