VEDALOGIC - um método para a verificação de dados climatológicos.

AUTOR(ES)
DATA DE PUBLICAÇÃO

2008

RESUMO

Esta pesquisa aborda o desenvolvimento de um Método para a Verificação de Dados Climatológicos -- VEDALOGIC, que se utiliza de modelos criados com algoritmos de Mineração de Dados. Este método utiliza modelos de clustering para a determinação de grupos homogêneos em um Banco de Dados Climatológicos (BDC). A partir desses grupos pode-se detectar dados suspeitos. Após a detecção de um dado suspeito, este será predito, baseado em um modelo de árvore de decisão gerado a partir de uma série histórica de dados. Em seguida, compara-se o valor predito com o valor do dado suspeito e caso haja uma diferença superior a 4%, o dado suspeito é considerado como um ruído. Uma vez detectado um ruído, uma mensagem é gerada contendo: o campo com o dado ruidoso; o intervalo de valores esperados; e uma sugestão para o ajuste com um valor pontual. A partir de alguns experimentos realizados, constatou-se que os ajustes baseados nas informações fornecidas pelo VEDALOGIC, contribuirão para o aumento da qualidade e da confiabilidade dos dados contidos no BDC. Para a construção dos modelos utilizados no VEDALOGIC, utilizou-se os algoritmos EM e K-means para gerar os modelos de clustering e os algoritmos M5P e REPTree para gerar os modelos de árvore de decisão. Para a verificação do método proposto, inseriu-se ruídos no BDC. Após aplicar o VEDALOGIC o resultado mais significativo foi a detecção de todos os ruídos inseridos e que os valores sugeridos para correção atingiram uma média de precisão acima de 97%.

ASSUNTO(S)

climatologia banco de dados processamento de dados mineração de dados análise de aglomerados algoritmos

Documentos Relacionados