Study and implementation of data Preload optimization using XScale / Estudo e implementação da otimização de Preload de dados usando o processador XScale
AUTOR(ES)
Marcio Rodrigo de Oliveira
DATA DE PUBLICAÇÃO
2005
RESUMO
Atualmente existe um grande mercado para o desenvolvimento de aplicações para sistemas embutidos, pois estes estão fazendo parte crescente do cotidiano das pessoas em produtos de eletrônica de consumo como telefones celulares, palmtop s, agendas eletrônicas, etc. Os produtos de eletrônica de consumo possuem grandes restrições de projeto, tais como custo reduzido, baixo consumo de potência e muitas vezes alto desempenho. Deste modo, o código produzido pelos compiladores para os programas executados nestes produtos, devem executar rapidamente, economizando energia de suas baterias. Estes melhoramentos são alcançados através de transformações no programa fonte chamadas de otimizações de código. A otimização preload de dados consiste em mover dados de um alto nível da hierarquia de memória para um baixo nível dessa hierarquia antes deste dado ser usado. Este é um método que pode reduzir a penalidade da latência de memória. Este trabalho mostra o desenvolvimento da otimização de preload de dados no compilador Xingo para a plataforma Pocket PC, cuja arquitetura possui um processador XScale. A arquitetura XScale possui a instrução preload, cujo objetivo é fazer uma pré-busca de dados para a cache. Esta otimização insere (através de previsões) a instrução preload no código intermediário do programa fonte, tentando prever quais dados serão usados e que darão miss na cache (trazendo-os para esta cache antes de seu uso). Com essa estratégia, tenta-se minimizar a porcentagem de misses na cache de dados, reduzindo o tempo gasto em acessos à memória. Foram usados neste trabalho vários programas de benchmarks conhecidos para a avaliação dos resultados, dentre eles destacam-se DSPstone e o MiBench. Os resultados mostram que esta otimização de preload de dados para o Pocket PC produz um aumento considerável de desempenho para a maioria dos programa testados, sendo que em vários programas observou-se uma melhora de desempenho maior que 30%!
ASSUNTO(S)
computer architecture arquitetura de computador compiladores (computadores) sistemas de memoria de computadores compiling (eletronic computers) computer memory systems
ACESSO AO ARTIGO
http://libdigi.unicamp.br/document/?code=vtls000383518Documentos Relacionados
- Study and implementation of cryptographic hash algorithms on the Intel XScale platform
- Implementation and study of the Wolf Dataflow Architecture.
- Study and implementation of a connected digit recognition system using continuous HMMs
- Global optimization using dense trajectories and applications
- Rede serial para comunicação de dados e controle em sistema embarcado: estudo de implementação da ISO 11783