Classificação automatica e analise de dados por redes neurais auto-organizaveis

AUTOR(ES)
DATA DE PUBLICAÇÃO

1999

RESUMO

Esta tese apresenta extensões ao modelo básico de rede neural auto-organizável, a rede de Kohonen (SOM), viabilizando seu uso como ferramenta de análise de agrupamentos. O SOM define, via treinamento não supervisionado, um mapeamento de um espaço p-dimensional contínuo para um conjunto discreto de vetores referência, ou neurônios, geralmente dispostos na forma de uma matriz. Cada neurônio tem a mesma dimensão do espaço de entrada, p, e o objetivo principal do treinamento é reduzir imensionalidade ao mesmo tempo em que tenta-se preservar, ao máximo, a topologia do espaço de entrada. O algoritmo SL-SOM (Self-Labeling SOM) foi desenvolvido com o objetivo de particionar e rotular automaticamente um SOM treinado, baseando-se no gradiente dos p componentes, cuja informação é apresentada na Umatrix. Usa-se algoritmos de processamento de imagem para segmentar a U-matrix e o resultado são regiões conectadas de neurônios codificados sob o mesmo rótulo. Tais regiões definem no espaço de atributos geometrias complexas e não paramétricas, possibilitando também a classificação de novas amostras. A extensão do SL-SOM tem por objetivo descobrir e representar subclasses. O TS-SLSOM (Tree-Structured Self-Labeling SOM) gera sub-redes para cada região rotulada de neurônios na forma de uma árvore dinâmica. Não se especifica a priori o número de sub-redes para uma dada rede, e os parâmetros de cada sub-rede são funções dos parâmetros da rede pai , e do subconjunto de dados que será usado para treiná-Ia. Sub-redes que não apresentam subpartições são excluídas, e o conjunto de dados referente àquela sub-rede fica representado apenas pela região rotulada de neurônios na rede pai . Arranjos de neurônios do SOM de dimensões elevadas não são usados na prática por que o objetivo principal do SOM na atualidade é a visualização dos dados. Com a automação da descoberta de conhecimento e relacionamentos entre dados descritas pelo SL-SOM e TSSL- SOM, pode-se usar um arranjo dimensão igualou menor que a dimensão do espaço de entrada, e fazer com que apenas os resultados finais sejam mostrados, na forma de subgrupos de dados, o relacionamento entre os subgrupos, etc. A principal motivação para o uso do SOM p-dimensional é a manutenção da topologia que geralmente é perdida quando diminuímos a dimensionalidade via mapeamento de um espaço p-dimensional para um espaço de menor dimensão. Define-se o U-array como uma extensão da U-matrix e propõe-se métodos de análise baseados nos métodos de segmentação utilizados em redes de dimensão I ou 2. Comparações de resultados para vários conjuntos de dados são efetuados em relação ao SOM convencional, ou alguns de seus variantes, e por métodos estatísticos e heurísticos para descoberta de agrupamentos, sendo o principal deles, o método de misturas de densidades de probabilidades usando o algoritmo Expectation Maximization. As aplicações dos resultados desta tese são inúmeras. Pode-se aplicar técnicas de análise de dados em qualquer área do conhecimento humano que possa coletar informações. Com a disponibilidade crescente de instrumentação eletrônica capacitando aplicações diversas adquirirem dados e armazená-los em computadores, ou mesmo a imensa massa de dados e informações não estruturadas na internet, ferramentas como as descritas nesta tese, com certeza, farão parte de softwares em um futuro não distante

ASSUNTO(S)

redes neurais (computação) inteligencia artificial analise por conglomerados sistemas de reconhecimento de padrões

Documentos Relacionados