The detection of spatial clusters: graph and dynamic programming based methods

AUTOR(ES)
FONTE

IBICT - Instituto Brasileiro de Informação em Ciência e Tecnologia

DATA DE PUBLICAÇÃO

01/07/2011

RESUMO

Esta tese aborda o problema de detecção de clusters espaciais e espaços-temporais. Dois algoritmos para resolver o típico problema de conjuntos de dados com processos espaciais são propostos. Um método eficiente para a detecção e inferência de clusters de doenças espaciais e espaços-temporais de dados pontuais é apresentado, o Voronoi Based Scan (VBScan). Um diagrama de Voronoi é construído para os pontos que representam indivíduos da população (casos e controles). O número de células de Voronoi interceptadas pelo segmento de linha que une de dois pontos que representam dois casos define a distância de Voronoi entre esses pontos. Esta distância é usada para aproximar a densidade da população heterogenia e construir a árvore geradora m·nima baseada na distância de Voronoi (VMST) ligando os casos. A remoção sucessiva de arestas da VMST gera sub-arvores que são os clusters candidatos potenciais. Finalmente, os clusters são avaliados através da estatística scan de Kulldorff. Simulações de Monte Carlo dos dados originais são usados para avaliar a significância dos clusters. A capacidade de detectar rapidamente clusters de surtos da doença, quando o número de indivíduos é grande, mostrou-se viável, devido à redução da carga computacional obtida com o VBScan. As simulações numéricas mostraram que o VBScan tem maior poder de detecção, sensibilidade e valor preditivo positivo do que o scan elíptico. Além disso, uma aplicação de casos e controles georeferenciados de dengue em uma cidade do Brasil é apresentado. Numa segunda abordagem, o problema típico de detecção de clusters espaciais é reformulado como um problema bi-objetivo de otimização combinatória Nós propomos um algoritmo exato baseado em programação dinâmica, Geographical Dynamic Scan, que empiricamente foi capaz de resolver os casos até de grande porte dentro de tempo computacional aceitável. Nós mostramos que o conjunto de soluções não dominadas do problema, encontradas eficientemente, contém a solução que maximiza a estatística scan de Kulldorf. O método permite clusters de formatos arbitrários, que podem ser uma coleção de regiões desconectadas ou conectadas, tendo em conta uma restrição geográfica. Note-se que esta não é uma séria desvantagem, desde que não haja um grande espaçamento entre as suas áreas. Apresentamos uma comparação empírica de detecção e precisão espacial entre o nosso algoritmo e o clássico Scan circular, utilizando dados de casos de doença de Chagas em mulheres parturientes no estado de Minas Gerais, Brasil.

ASSUNTO(S)

engenharia elétrica teses.

Documentos Relacionados