Sistema para agrupamento de dados baseado no comportamento superparamagnÃtico do modelo de Potts

AUTOR(ES)
DATA DE PUBLICAÇÃO

2004

RESUMO

O agrupamento de dados à uma das operaÃÃes mais importantes na anÃlise de informaÃÃes. Esta operaÃÃo consiste em, dada uma massa de informaÃÃes a respeito de uma populaÃÃo de indivÃduos, procurar grupos de elementos semelhantes entre si e diferentes dos outros. Essa tÃcnica encontra aplicaÃÃes em praticamente todas as Ãreas, desde anÃlise de imagens atà bioinformÃtica. Quando o volume de dados à considerÃvel, o problema se torna computacionalmente muito difÃcil. Recentemente foi estabelecida uma analogia entre o problema de agrupamento e a procura de configuraÃÃes tÃpicas de um modelo fÃsico, o modelo de Potts. Dado que existem algoritmos eficientes para a localizaÃÃo dessas configuraÃÃes, como por exemplo a dinÃmica de Swendsen-Wang, à possÃvel aplicar essas tÃcnicas para um grande volume de dados e em uma grande diversidade de situaÃÃes. Para verificar essa analogia foi desenvolvido o programa SPC, em linguagem C, pelo Professor Eytan Domany, do Departamento de FÃsica de Sistemas Complexos, do Instituto de CiÃncia de Weizmann, em Israel. A funÃÃo principal desse programa à a geraÃÃo de agrupamentos de dados utilizando uma nova tÃcnica de agrupamento baseada na analogia citada. Essa tÃcnica ficou conhecida como âsuperparamagnÃticaâ e se baseia na procura de ocorrÃncias de um certo modelo de Potts nÃo-homogÃneo em um estÃgio intermediÃrio entre duas fases do magnetismo, a ferromagnÃtica e a paramagnÃtica. O programa SPC utiliza a dinÃmica de Swendsen-Wang para simular os estados âtÃpicosâ do modelo de Potts. Esta dissertaÃÃo estuda essa tÃcnica de agrupamento e apresenta proposta, construÃÃo e avaliaÃÃo de um sistema amigÃvel para sua aplicaÃÃo em diversas situaÃÃes. O resultado deste trabalho à uma interface amigÃvel, desenvolvida em IDL, que permite tanto a especificaÃÃo dos parÃmetros que determinam o funcionamento do algoritmo SPC quanto a anÃlise dos resultados por ele produzidos. Esta anÃlise permite a visualizaÃÃo dos agrupamentos superparamagnÃticos atravÃs de grÃficos hierÃrquicos (dendrogramas). Esses dendrogramas oferecem ao usuÃrio mecanismos de interaÃÃo para descoberta de informaÃÃes, bem como anÃlises quantitativas (mÃdia, variÃncia, mediana, curtose, coeficiente e assimetria, entre outras) e qualitativas (Brushplots) dos dados. A junÃÃo desse sistema com o programa SPC foi empregada com sucesso na anÃlise de dados

ASSUNTO(S)

interaÃÃo ciencia da computacao physical model agrupamento de dados interface modelo fÃsico data clustering interface dendrograma interaction dendrogram

Documentos Relacionados