FD-Sensi: um detector de falhas adaptativo e sua aplicação a um sistema distribuído em larga escala

AUTOR(ES)
DATA DE PUBLICAÇÃO

2009

RESUMO

Os detectores de falhas consistem num componente essencial em qualquer sistema distribuído tolerante a falhas. Um detector de falhas ideal deve adaptar-se a variadas condições de rede e carga do sistema, de maneira a prover informações rápidas e precisas sobre processos falhos aos outros módulos do sistema tolerante a falhas. Este trabalho apresenta a avaliação de um novo algoritmo de detecção de falhas, FD-Sensi, que é capaz de lidar com sistemas distribuídos altamente sobrecarregados e redes de comunicação com grandes variações de latência de mensagens. Foi realizada a avaliação do FD-Sensi tanto em cenários com cargas sintéticas quanto cenários com cargas reais da Internet, utilizando dados coletados em uma centena de nós do PlanetLab. Os dados foram utilizados para comparar seu desempenho com um dos melhores algoritmos de detecção da atualidade, Adaptive Accrual. Os resultados mostram que o FD-Sensi teve um desempenho superior ao Adaptive Accrual, apresentando uma significativa redução da emissão de falso-positivos com a manutenção de um baixo tempo médio de detecção. O trace coletado no PlanetLab poderá ser utilizado na avaliação de novos algoritmos de detecção de falhas e, através de sua análise, este trabalho fornece também as distribuições estatísticas mais apropriadas para a modelagem de atrasos de rede em ambientes globalmente distribuídos. Por fim, propomos uma técnica de aperfeiçoamento para algoritmos de detecção que, baseando-se na correlação entre a carga do nó monitorado e os atrasos percebidos possibilitou-nos melhorar significativamente a precisão e velocidade da detecção de falhas.

ASSUNTO(S)

sistemas distribuídos teses computação teses.

Documentos Relacionados