The detection of spatial clusters: graph and dynamic programming based methods
AUTOR(ES)
Gladston Juliano Prates Moreira
FONTE
IBICT - Instituto Brasileiro de Informação em Ciência e Tecnologia
DATA DE PUBLICAÇÃO
01/07/2011
RESUMO
Esta tese aborda o problema de detecção de clusters espaciais e espaços-temporais. Dois algoritmos para resolver o típico problema de conjuntos de dados com processos espaciais são propostos. Um método eficiente para a detecção e inferência de clusters de doenças espaciais e espaços-temporais de dados pontuais é apresentado, o Voronoi Based Scan (VBScan). Um diagrama de Voronoi é construído para os pontos que representam indivíduos da população (casos e controles). O número de células de Voronoi interceptadas pelo segmento de linha que une de dois pontos que representam dois casos define a distância de Voronoi entre esses pontos. Esta distância é usada para aproximar a densidade da população heterogenia e construir a árvore geradora m·nima baseada na distância de Voronoi (VMST) ligando os casos. A remoção sucessiva de arestas da VMST gera sub-arvores que são os clusters candidatos potenciais. Finalmente, os clusters são avaliados através da estatística scan de Kulldorff. Simulações de Monte Carlo dos dados originais são usados para avaliar a significância dos clusters. A capacidade de detectar rapidamente clusters de surtos da doença, quando o número de indivíduos é grande, mostrou-se viável, devido à redução da carga computacional obtida com o VBScan. As simulações numéricas mostraram que o VBScan tem maior poder de detecção, sensibilidade e valor preditivo positivo do que o scan elíptico. Além disso, uma aplicação de casos e controles georeferenciados de dengue em uma cidade do Brasil é apresentado. Numa segunda abordagem, o problema típico de detecção de clusters espaciais é reformulado como um problema bi-objetivo de otimização combinatória Nós propomos um algoritmo exato baseado em programação dinâmica, Geographical Dynamic Scan, que empiricamente foi capaz de resolver os casos até de grande porte dentro de tempo computacional aceitável. Nós mostramos que o conjunto de soluções não dominadas do problema, encontradas eficientemente, contém a solução que maximiza a estatística scan de Kulldorf. O método permite clusters de formatos arbitrários, que podem ser uma coleção de regiões desconectadas ou conectadas, tendo em conta uma restrição geográfica. Note-se que esta não é uma séria desvantagem, desde que não haja um grande espaçamento entre as suas áreas. Apresentamos uma comparação empírica de detecção e precisão espacial entre o nosso algoritmo e o clássico Scan circular, utilizando dados de casos de doença de Chagas em mulheres parturientes no estado de Minas Gerais, Brasil.
ASSUNTO(S)
ACESSO AO ARTIGO
http://hdl.handle.net/1843/BUOS-8MCG9ADocumentos Relacionados
- DYNAMIC PROGRAMMING, SEQUENTIAL ESTIMATION AND SEQUENTIAL DETECTION PROCESSES
- Nonparametric intensity bounds for the detection and delineation of spatial clusters
- MERCOSUR in trade policy clusters: challenges and prospects
- Automatic detection of conserved gene clusters in multiple genomes by graph comparison and P-quasi grouping
- Clusters of clusters: self-organization and self-similarity in the intermediate stages of cluster growth of Au-Ag supraclusters.