Análise de desempenho da arquitetura CUDA utilizando os NAS parallel benchmarks
AUTOR(ES)
Pilla, Laercio Lima
DATA DE PUBLICAÇÃO
2010
RESUMO
Processadores gráficos vêm sendo utilizados como aceleradores paralelos para computações de propósito geral (GPGPU), não detidos mais apenas em aplicações gráficas. Isto acontece devido ao custo reduzido e grande potencial de desempenho paralelo dos processadores gráficos, alcançando Teraflops. CUDA (Compute Unified Device Architecture) é um exemplo de arquitetura com essas características. Diversas aplicações já foram portadas para CUDA nas áreas de dinâmica de fluídos, reconhecimento de fala, alinhamento de sequências, entre outras. Entretanto, não há uma definição clara de quais tipos de aplicações podem se aproveitar dos potenciais ganhos de desempenho que as GPGPUs trazem, visto que a arquitetura do hardware é do tipo SIMD (Simple Instruction, Multiple Data) e que existem restrições nos acessos à memória. Visando estudar esta questão, este trabalho apresenta uma análise de desempenho da arquitetura de placa gráfica CUDA guiada por modelos paralelos e benchmarks. Para isso, os benchmarks EP e FT dos NAS Parallel Benchmarks foram portados e otimizados para CUDA, mantendo o uso de operações de ponto flutuante de precisão dupla. Estes dois benchmarks fazem parte das categorias MapReduce e Spectral Methods, respectivamente, dentro da classificação Dwarf Mine. Uma análise de desempenho foi realizada, fazendo uma comparação entre os resultados obtidos pelas novas versões implementadas e as versões originais do código compiladas para execução de forma sequencial e paralela com OpenMP. Os resultados obtidos mostraram speedups de até 21 vezes para o benchmark EP e quase 3 vezes para o benchmark FT, quando comparadas as versões para CUDA com as versões com OpenMP. Estes resultados indicam uma compatibilidade entre a arquitetura CUDA e aplicações pertencentes às categorias MapReduce e Spectral Methods.
ASSUNTO(S)
gpgpu processamento paralelo mpi parallel computing performance analysis
ACESSO AO ARTIGO
http://hdl.handle.net/10183/18536Documentos Relacionados
- Analise de desempenho de banco de dados utilizando Benchmarks especializados
- Propostas de implementação de qualidade de serviço na arquitetura VPN MPLS, utilizando linguagem de especificação formal SDL orientada a objetos e análise de desempenho utilizando o simulador OPNET
- Estabelecimento e uso de benchmarks na sustentabilidade do desempenho de processos industriais
- Análise fundos de investimento da Caixa Econômica Federal em comparação aos seus benchmarks
- Modelagem e analise de desempenho de uma arquitetura de fluxo de dados