RAI4P: IA Responsable para Minería de Procesos 2.0

RAI4P es un avance hacia la minería de procesos 2.0, una minería de procesos centrada en la inteligencia de procesos más que en el análisis descriptivo. En particular, nos centraremos en la monitorización predictiva, es decir, en la predicción de algunas características del proceso, como la siguiente actividad, el tiempo restante, los recursos, los resultados, etc. Además, esta predicción podría realizarse para un instante concreto, o considerar todo el ciclo de vida del proceso a fin de inferir información a más largo plazo, como los porcentajes de ejecución de los diferentes caminos, la demanda de recursos, etc.

Además, aplicaremos las técnicas de minería de procesos a procesos para los cuales los eventos no están inicialmente disponibles y almacenados en una plataforma de gestión de procesos empresariales (BPM), sino que deben ser identificados y extraídos de vídeos. Esto abre la puerta a la aplicación de la monitorización predictiva a los procesos que no están (totalmente) automatizados, ya que los ficheros de registros se generarán mediante técnicas de análisis de vídeo. Se trata de un doble desafío: para la analítica de vídeo, será necesario generar eventos de alta calidad para permitir predicciones precisas; para la minería de procesos, los algoritmos deben hacer frente a los datos ruidosos y/o faltantes debido a la dificultad de detectar todos los eventos en los vídeos.

Esta propuesta seguirá las Ethics Guidelines for Trustworthy Artificial Intelligence, recientemente presentadas por el EU High-Level Expert Group on AI, puesto que aplicaremos los principios de la Inteligencia Artificial Responsable a todos los modelos que desarrollemos en el proyecto, para garantizar que tanto los datos como los algoritmos sean responsables, transparentes, justos, fiables y explicables. También investigaremos en los modelos de generación de lenguaje natural adaptados para la minería de procesos 2.0, incluyendo la generación de descripciones textuales tanto para los modelos de procesos como para la analítica basada en la Inteligencia Artificial. El uso del lenguaje natural en este campo será una forma novedosa de integrar explicaciones post-hoc sobre los procesos y sobre la información analítica extraída de ellos.

Objetivos

El objetivo de RAI4P es diseñar modelos de monitorización predictiva de procesos con conciencia de responsabilidad de la IA. Además, buscamos dar soporte a escenarios del mundo real en los que los procesos no son explícitos y deben ser inferidos del entorno, en este proyecto a través de la analítica de vídeo. Este enfoque supondrá un reto importante tanto desde la perspectiva de la identificación y generación de eventos a partir de flujos de vídeo como desde la perspectiva de la minería de procesos, ya que los algoritmos aprenderán a partir de registros que podrían tener una distribución de trazas desequilibrada y, además, tendrán datos perdidos debido a la dificultad de capturar todos los eventos de los vídeos. Además, utilizaremos descripciones en lenguaje natural para explicar cómo y por qué se han generado los modelos predictivos de monitorización. Este objetivo general puede dividirse en los siguientes objetivos específicos:

  • Desarrollar nuevos modelos de DL basados en redes neuronales gráficas que: (i) mejoren las predicciones intra e inter-trazados aprovechando la información que se puede inferir de los trazados, incluyendo los modelos de procesos, los patrones de comportamiento frecuentes e infrecuentes, los datos de comprobación de conformidad y las derivas repentinas y graduales; (ii) mejoren las predicciones ajustando la distribución de los trazados siempre que los registros estén desequilibrados, y añadiendo tolerancia al ruido.
  • Desarrollar detectores y rastreadores basados en CNN que generen registros de alta calidad para la minería de procesos mediante (i) mejorando la precisión de la detección de objetivos pequeños, trabajando con mapas de características de alta resolución en las capas más profundas; (ii) explotando la información temporal de los vídeos mediante la vinculación de objetos a corto y largo plazo; (iii) diseñando arquitecturas CNN siamesas para el seguimiento de múltiples objetos.
  • Considerar todas las dimensiones relevantes de la IA responsable en la minería de procesos. Asimismo, integrar las descripciones en lenguaje natural con otras modalidades de explicación, para lograr explicaciones multimodales que transmitan la información relevante adaptada a las necesidades y expectativas reales de los usuarios.