Una nueva técnica de aumentado de datos para la clasificación de imágenes hiperespectrales mediante CNN

En los últimos años, los esquemas de clasificación basados en el aprendizaje profundo (DL) para datos hiperespectrales de teledetección han sido introducidos con notable éxito debido a su capacidad para adaptarse a las características no lineales de la información que conforma las imágenes hiperespectrales. En particular, las redes neuronales convolucionales (CNN) se han utilizado con éxito para resolver problemas que requieren clasificación multiclase en el campo de la teledetección. Las CNN operan sobre parches en lugar de basarse únicamente en la información espectral correspondiente a cada píxel siendo un parche una pequeña área de la imagen centrada en uno de sus píxeles. Estas redes requieren un elevado número de observaciones para producir un modelo de clasificación generalizable. En estas circunstancias en que el número de píxeles de la imagen es pequeño las técnicas de aumentado de datos pueden ayudar a paliar el problema mediante la generación de nuevas muestras sintéticas a partir de los datos existentes. La imputación es una técnica estadística que consiste en completar los valores que faltan o sustituir algunos de los valores de un subconjunto de observaciones por otros obtenidos mediante inferencia a partir del conjunto de datos original. En este trabajo se presenta una primera aproximación a una técnica de aumentado de datos basada en el uso de técnicas de imputación de datos para la clasificación mediante CNNs. La aplicación de técnicas de imputación puede resultar computacionalmente compleja y afectará fundamentalmente al proceso de entrenamiento. El coste computacional debe, por tanto, tenerse en cuenta a la hora de seleccionar una técnica de imputación en particular.

Palabras clave: Hyperspectral, Data augmentation, CNN, Data imputation