Proyección de Algoritmos de Resolución de Sistemas Tridiagonales en la Tarjeta Gráfica

La proyección de algoritmos en la tarjeta gráfica puede ofrecer buenos valores de rendimiento incluso para problemas considerados poco adecuados para su implementación sobre esta arquitectura, como es el caso de la resolución de sistemas de ecuaciones tridiagonales. En este trabajo hemos analizado el rendimiento de tres algoritmos de resolución de sistemas de ecuaciones tridiagonales implementados con CUDA en la tarjeta gráfica. Para cada algoritmo hemos analizado la viabilidad de diferentes implementaciones: usando accesos sólo a memoria global, haciendo uso de memoria compartida para reducir el tiempo de acceso a memoria y reduciendo el número de accesos a memoria.

Palabras clave: sistemas tridiagonales, doblamiento recursivo, reducción cíclica, divide y vencerás, GPU, CUDA