Uma abordagem para detecção de outliers em dados categoricos
AUTOR(ES)
Flavio Roberto Silva
DATA DE PUBLICAÇÃO
2004
RESUMO
Outliers são elementos que não obedecem a um padrão do conjunto de dados ao qual eles pertencem. A detecção de outliers pode trazer informações não esperadas e importantes para algumas aplicações, como por exemplo: descoberta de fraudes em sistemas telefônicos e de cartão de crédito e sistemas de detecção de intrusão. Esta dissertação apresenta uma nova abordagem para detecção de outliers em bancos de dados com atributos categóricos. A abordagem proposta usa modelos log-lineares como um padrão para o conjunto de dados, o que torna mais fácil a tarefa de interpretação dos resultados pelo usuário. Também é apresentado o FOCaD (Finding Outliers in Categorical Data), protótipo de um sistema de análise de dados categóricos. Ele ajusta e seleciona modelos, faz testes estatísticos e detecta outliers
ASSUNTO(S)
banco de dados sistemas de recuperação da informação modelos log-lineares
ACESSO AO ARTIGO
http://libdigi.unicamp.br/document/?code=vtls000344339Documentos Relacionados
- Escore de incerteza em bancos de dados categóricos
- Uso da distribuição bivariada normal para detecção de outliers
- Uma abordagem para integração de dados baseada em confederação de ontologias.
- Uma abordagem multivariável baseada em wavelets para detecção de falhas em sistemas dinâmicos
- "Uma abordagem para pré-processamento de dados textuais em algoritmos de aprendizado"