Una aproximación basada en Machine Learning para evaluar la influencia del tamaño del proyecto en la detección de God Class.
En este documento abordamos la detección de problemas en el software, que no impiden su compilación ni ejecución, y a los que nos referiremos como Design Smells. La detección de Design Smells ha demostrado ser una estrategia eficaz para mejorar la calidad del software y, en consecuencia, reducir los gastos de mantenimiento. En este trabajo, exploramos la influencia del tamaño del proyecto de software, expresado como una categoría textual, en la detección automática de Desing Smell, en particular del denominado God Class mediante diferentes técnicas de aprendizaje automático. Se realizó un conjunto de experimentos con ocho clasificadores diferentes en un conjunto de datos formado por 12.588 clases de 24 proyectos software diferentes. Los resultados fueron evaluados usando como indicadores el área ROC y Kappa. El estudio confirma que los clasificadores se adaptan para tener en cuenta la información sobre el tamaño de los proyectos y se concluye que es posible mejorar el resultado de la clasificación realizada para establecer si una determinada clase es una God Class o no cuando los algoritmos utilizados disponen de la información sobre el tamaño del proyecto al que pertenece la clase
keywords: Design Smell, Machine Learning, Software Quality