Suporte à padronização das cartas de solos do cerrado utilizando mineração de textos

AUTOR(ES)
DATA DE PUBLICAÇÃO

2009

RESUMO

A informação em meio digital existente hoje em dia está representada, em sua maior parte, no formato textual. Pesquisas recentes mostram a pertinência das técnicas de Mineração de Textos (MT) no tratamento desta enorme quantidade de informação para transformá-la em fonte de conhecimento. Atividades de organização da informação para a tomada de decisão têm sido impulsionadas pelo uso da MT. Este trabalho aborda o problema da geração de taxonomias a partir de um conjunto de textos. Taxonomia refere-se à organização hierárquica de objetos. O objetivo é prover subsídios aos especialistas de um determinado domínio para a criação de taxonomias a partir da aplicação de técnicas de análise de agrupamentos textuais. O estudo de caso aborda um problema real na área de classificação de mapas de solos do Cerrado. Este problema tem sua origem no final dos anos 70, quando diversas instituições realizaram, independentemente, classificações de solos na região servindose de um mesmo conjunto padronizado de descritores. Entretanto, cada instituição rotulou de forma distinta as classes encontradas, levando à proliferação de diferentes rótulos para as mesmas classes. A solução proposta neste trabalho é a aplicação de um processo cíclico de agrupamento sobre o conjunto das legendas. Esse processo constitui-se dos seguintes passos: (i) geração de configurações de agrupamentos de legendas; (ii) interação com especialistas do domínio para análise das configurações; (iii) reelaboração dos agrupamentos a partir da análise dos especialistas. O critério de parada do processo é a obtenção de uma taxonomia das legendas que, à luz do conhecimento dos especialistas em pedologia envolvidos, seja aceitável como um padrão de nomenclatura. A pertinência do método proposto foi parcialmente aferida com a geração de uma primeira taxonomia com base em um subconjunto das legendas. A continuidade do processo até um resultado plenamente satisfatório depende de um esforço considerável por parte dos especialistas envolvidos.

ASSUNTO(S)

vegetação classificação mapeamento do solo organização de arquivos computação ciencia da informacao text mining taxonomy soil maps clustering analysis

Documentos Relacionados