Detección de la enfermedad COVID19 y triaje de pacientes con inteligencia artificial aprendiendo ...

Detección de la enfermedad COVID19 y triaje de pacientes con inteligencia artificial aprendiendo de radiografías de tórax

El análisis automatizado de imágenes RXT mediante modelos de Inteligencia Artificial (IA) y Deep Learning (DL) tiene un gran potencial para un rápido diagnóstico de la COVID19. Un modelo DL robusto y preciso puede servir como sistema de detección y soporte para la toma de decisiones médicas. Un conjunto de trabajos recientes afirman haber alcanzado sensibilidades impresionantes (>90%), superiores a las de los radiólogos expertos (69%). Estas altas sensibilidades se deben al sesgo en el conjunto de datos más utilizado, COVID19 Image Data Collection. Este conjunto incluye un número reducido de casos positivos de COVID19, procedentes de fuentes muy heterógeneas (al menos 15 países) y la mayoría de los casos son pacientes graves, lo que reduce drásticamente su valor clínico. Para contraste de clases de no COVID, utilizan imágenes RXT de diversos repositorios públicos de enfermedades pulmonares. Los modelos resultantes no tienen ningún valor clínico ya que no podrán detectar pacientes de gravedad baja y moderada, que son el objetivo de un sistema de cribado clínico. Ante esta situación, existe una enorme necesidad de conjuntos de datos de mayor calidad construidos bajo el mismo protocolo clínico y en estrecha colaboración con radiólogos expertos.

El aprendizaje automático federado es un enfoque que permite que los modelos de DL se entrenen en el entorno local, de forma distribuida, se envían a un servidor central donde se agregan sus pesos, y se reenvía un modelo consolidado a todos los dispositivos/nodos para continuar el aprendizaje. Utiliza conceptos de computación distribuida para realizar un seguimiento de cada modelo en los nodos y agregar y actualizar modelos en cada uno de los nodos.

Objetivos

El objetivo global del proyecto es desarrollar un sistema robusto para la detección de la COVID19 y de neumonías bacteriana y virales para el triaje de pacientes. Se divide en cinco objetivos específicos:

1. Ampliar la base de datos COVIDGR con radiografías COVID19, de diferentes hospitales nacionales e internacionales y convertirla en pública.
2. Desarrollar un sistema inteligente que incremente la detección en los 3 estadios de severidad de la COVID19, con el uso de técnicas de calidad de datos (smart data), DL y jerarquización de múltiples clases, y la posible inclusión de datos clínicos.
3. Desarrollar un modelo robusto sobre diferentes regímenes de RX (diferentes hospitales) usando el aprendizaje federado, detectando la COVID19 para cualquier máquina de Rayos X.
4. Desarrollar modelos de DL para distinguir entre COVID19 y diferentes enfermedades pulmonares, tales como derrame pleural, atelectasia, cardiomegalia, infiltrado, nódulo pulmonar, neumonía, ...
5. Diseñar métodos para interpretar/explicar las decisiones de los modelos de DL mediante nuevas metodologías XAI.

El análisis automatizado de imágenes RXT mediante modelos de Inteligencia Artificial (IA) y Deep Learning (DL) tiene un gran potencial para un rápido diagnóstico de la COVID19. Un modelo DL robusto y preciso puede servir como sistema de detección y soporte para la toma de decisiones médicas. Un conjunto de trabajos recientes afirman haber alcanzado sensibilidades impresionantes (>90%), superiores a las de los radiólogos expertos (69%). Estas altas sensibilidades se deben al sesgo en el conjunto de datos más utilizado, COVID19 Image Data Collection. Este conjunto incluye un número reducido de casos positivos de COVID19, procedentes de fuentes muy heterógeneas (al menos 15 países) y la mayoría de los casos son pacientes graves, lo que reduce drásticamente su valor clínico. Para contraste de clases de no COVID, utilizan imágenes RXT de diversos repositorios públicos de enfermedades pulmonares. Los modelos resultantes no tienen ningún valor clínico ya que no podrán detectar pacientes de gravedad baja y moderada, que son el objetivo de un sistema de cribado clínico. Ante esta situación, existe una enorme necesidad de conjuntos de datos de mayor calidad construidos bajo el mismo protocolo clínico y en estrecha colaboración con radiólogos expertos. El aprendizaje automático federado es un enfoque que permite que los modelos de DL se entrenen en el entorno local, de forma distribuida, se envían a un servidor central donde se agregan sus pesos, y se reenvía un modelo consolidado a todos los dispositivos/nodos para continuar el aprendizaje. Utiliza conceptos de computación distribuida para realizar un seguimiento de cada modelo en los nodos y agregar y actualizar modelos en cada uno de los nodos.El objetivo global del proyecto es desarrollar un sistema robusto para la detección de la COVID19 y de neumonías bacteriana y virales para el triaje de pacientes. Se divide en cinco objetivos específicos: 1. Ampliar la base de datos COVIDGR con radiografías COVID19, de diferentes hospitales nacionales e internacionales y convertirla en pública. 2. Desarrollar un sistema inteligente que incremente la detección en los 3 estadios de severidad de la COVID19, con el uso de técnicas de calidad de datos (smart data), DL y jerarquización de múltiples clases, y la posible inclusión de datos clínicos. 3. Desarrollar un modelo robusto sobre diferentes regímenes de RX (diferentes hospitales) usando el aprendizaje federado, detectando la COVID19 para cualquier máquina de Rayos X. 4. Desarrollar modelos de DL para distinguir entre COVID19 y diferentes enfermedades pulmonares, tales como derrame pleural, atelectasia, cardiomegalia, infiltrado, nódulo pulmonar, neumonía, ... 5. Diseñar métodos para interpretar/explicar las decisiones de los modelos de DL mediante nuevas metodologías XAI. - Manuel Mucientes Molina, María José Carreira Nouche - José María Alonso Moral, Nicolás Vila Blanco