FD-Sensi: um detector de falhas adaptativo e sua aplicação a um sistema distribuído em larga escala
AUTOR(ES)
Everthon Valadao dos Santos
DATA DE PUBLICAÇÃO
2009
RESUMO
Os detectores de falhas consistem num componente essencial em qualquer sistema distribuído tolerante a falhas. Um detector de falhas ideal deve adaptar-se a variadas condições de rede e carga do sistema, de maneira a prover informações rápidas e precisas sobre processos falhos aos outros módulos do sistema tolerante a falhas. Este trabalho apresenta a avaliação de um novo algoritmo de detecção de falhas, FD-Sensi, que é capaz de lidar com sistemas distribuídos altamente sobrecarregados e redes de comunicação com grandes variações de latência de mensagens. Foi realizada a avaliação do FD-Sensi tanto em cenários com cargas sintéticas quanto cenários com cargas reais da Internet, utilizando dados coletados em uma centena de nós do PlanetLab. Os dados foram utilizados para comparar seu desempenho com um dos melhores algoritmos de detecção da atualidade, Adaptive Accrual. Os resultados mostram que o FD-Sensi teve um desempenho superior ao Adaptive Accrual, apresentando uma significativa redução da emissão de falso-positivos com a manutenção de um baixo tempo médio de detecção. O trace coletado no PlanetLab poderá ser utilizado na avaliação de novos algoritmos de detecção de falhas e, através de sua análise, este trabalho fornece também as distribuições estatísticas mais apropriadas para a modelagem de atrasos de rede em ambientes globalmente distribuídos. Por fim, propomos uma técnica de aperfeiçoamento para algoritmos de detecção que, baseando-se na correlação entre a carga do nó monitorado e os atrasos percebidos possibilitou-nos melhorar significativamente a precisão e velocidade da detecção de falhas.
ASSUNTO(S)
sistemas distribuídos teses computação teses.
ACESSO AO ARTIGO
http://hdl.handle.net/1843/SLSS-7XGFF4Documentos Relacionados
- A avaliação em larga escala no Brasil: análise comparativa entre o SAEB e um sistema privado
- Injeção distribuída de falhas para validação de dependabilidade de sistemas distribuídos de larga escala
- Um protocolo para contratação de agentes em grupos de larga escala
- Teleconsultorias de fonoaudiologia em um serviço público de telessaúde de larga escala
- Um modelo hÃbrido e adaptativo para sistemas distribuÃdos tolerantes a falhas