Mapas auto-organizáveis na análise exploratória de dados geoespaciais multivariados / Self-organizing maps in the exploratory analysis of multivariate geospatial data

AUTOR(ES)
DATA DE PUBLICAÇÃO

2004

RESUMO

Os Mapas Auto-Organizáveis têm sido aplicados, com sucesso, em variados problemas de análise exploratória de dados multivariados, todavia, poucos são os trabalhos voltados para a análise de dados coletados para unidades espaciais definidas, como os dados produzidos por censos demográficos, aqui chamados genericamente por dados geoespaciais. Este trabalho apresenta uma metodologia para a an´alise destes dados que contempla desde a verificação de dados atípicos até a análise de dependência espacial, fazendo uso, como ferramentas, somente do Mapa Auto-Organizável e seus algoritmos relacionados. Pode-se dividir a metodologia em quatro partes: detecção de dados atípicos através da análise da matriz de distância unificada (U-matriz), análise de componentes através dos Planos de Componentes, detecção automática de agrupamentos através do algoritmo Costa-Netto e análise da distribuição e dependência espaciais a partir dos Planos de Componentes e do particionamento dos dados na etapa anterior, respectivamente. Para a aplicação da metodologia proposta foi projetado e implementado um ambiente computacional integrado para an´alise explorat´oria de dados, que faz extensivo uso de banco de dados geogr´afico atrav´es da biblioteca aberta TerraLib (terralib.dpi.inpe.br). Compõem este ambiente a biblioteca SOMLib e o sistema CASA - Connectionist Approach for Spatial Analysis of Areal Data. A biblioteca SOMLib compreende um conjunto de classes em C++ projetadas a partir do uso de padrões de projeto e outras técnicas modernas de programação, cujo objetivo ´e implementar os algoritmos relacionados com os Mapas Auto-Organizáveis, de maneira a considerar a escalabilidade, a capacidade de manutenção do projeto e a conectividade com a biblioteca TerraLib. O sistema CASA é um simulador neural SOM 2-D, com interface gráfica, desenvolvido sobre as bibliotecas SOMLib e QT para execução das tarefas de análise exploratória de dados geoespaciais. Para validação da metodologia e do ambiente computacional de an´alise geográfica com redes SOM a mesma foi aplicada no problema de análise de indicadores de exclusão/inclusão social no município de São José dos Campos, São Paulo. Os resultados desta aplicação foram comparados com resultados anteriores, para o mesmo conjunto de dados, obtidos através de técnicas estatásticas e mostraram que os Mapas Auto-Organizáveis e os algoritmos relacionados são ferramentas robustas para a tarefa de análise exploratória de dados geoespaciais.

ASSUNTO(S)

computaÇÃo aplicada redes neurais inteligência artificial distribuição espacial sistemas de informações geográficas análise de agrupamento computer science neural nets artificial intelligence spatial distribution geographic information systems cluster analysis

Documentos Relacionados