Text Clustering
Mostrando 1-12 de 17 artigos, teses e dissertações.
-
1. Automated text clustering of newspaper and scientific texts in brazilian portuguese: analysis and comparison of methods
This article reports the findings of an empirical study about Automated Text Clustering applied to scientific articles and newspaper texts in Brazilian Portuguese, the objective was to find the most effective computational method able to cluster the input of texts in their original groups. The study covered four experiments, each experiment had four procedur
JISTEM J.Inf.Syst. Technol. Manag.. Publicado em: 2014-05
-
2. Representação de coleções de documentos textuais por meio de regras de associação / Representation of textual document collections through association rules
O número de documentos textuais disponíveis em formato digital tem aumentado incessantemente. Técnicas de Mineração de Textos são cada vez mais utilizadas para organizar e extrair conhecimento de grandes coleções de documentos textuais. Para o uso dessas técnicas é necessário que os documentos textuais estejam representados em um formato apropriad
IBICT - Instituto Brasileiro de Informação em Ciência e Tecnologia. Publicado em: 16/08/2011
-
3. Aprendizado não supervisionado de hierarquias de tópicos a partir de coleções textuais dinâmicas / Unsupervised learning of topic hierarchies from dynamic text collections
The need to extract new and useful knowledge from large textual collections has motivated researchs on Text Mining methods. Among the existing methods, initiatives for the knowledge organization by topic hierarchies are very popular. In the topic hierarchies, the knowledge is represented by topics and subtopics, and each topic contains documents of similar c
IBICT - Instituto Brasileiro de Informação em Ciência e Tecnologia. Publicado em: 19/05/2011
-
4. Enxame de partículas aplicado ao agrupamento de textos / Enxame de partículas aplicado ao agrupamento de textos
The large number of data generated by people and organizations has stimulated the research on effective and automatic methods of knowledge extraction from databases. This dissertation proposes two new bioinspired techniques, named cPSC and oPSC, based on the Particle Swarm Optimization Algorithm (PSO) to solve data clustering problems. The proposed algorithm
Publicado em: 2010
-
5. Análise de dados por meio de agrupamento fuzzy semi-supervisionado e mineração de textos / Data analysis using semisupervised fuzzy clustering and text mining
Esta Tese apresenta um conjunto de técnicas propostas com o objetivo de aprimorar processos de Agrupamento de Dados (AD). O principal objetivo é fornecer à comunidade científica um ferramental para uma análise completa de estruturas implícitas em conjuntos de dados, desde a descoberta dessas estruturas, permitindo o emprego de conhecimento prévio sobr
Publicado em: 2010
-
6. SeleÃÃo local de caracterÃsticas em agrupamento hierÃrquico de documentos
Hierarchical clustering of documents is used to provide interface for navigating through collections of documents, assisting in the activity of information retrieval. As the vectors representing the documents have a high dimensionality, the presence of irrelevant terms can harm the clustering algorithm. The use of feature selection in text clustering is able
Publicado em: 2009
-
7. Suporte à padronização das cartas de solos do cerrado utilizando mineração de textos
A informação em meio digital existente hoje em dia está representada, em sua maior parte, no formato textual. Pesquisas recentes mostram a pertinência das técnicas de Mineração de Textos (MT) no tratamento desta enorme quantidade de informação para transformá-la em fonte de conhecimento. Atividades de organização da informação para a tomada de
Publicado em: 2009
-
8. Analysis of the Clustering Algorithms for the Databases / Análise de Algoritmos de Agrupamento para Base de Dados Textuais
The increasing amount of digitally stored texts makes necessary the development of computational tools to allow the access of information and knowledge in an efficient and efficacious manner. This problem is extremely relevant in biomedicine research, since most of the generated knowledge is translated into scientific articles and it is necessary to have the
Publicado em: 2008
-
9. Sistemas baseados em mapas auto-organizÃveis para organizaÃÃo automÃtica de documentos texto
This work proposes and evaluates hybrid systems for automatic text document organization based on Self-Organizing Maps (SOM). The aim is to design a system that combines SOM with other clustering algorithms, in order to generate document maps for large text document collections of good quality at a low computational cost. The posprocessing of a neural networ
Publicado em: 2008
-
10. MINERAÇÃO DE TEXTOS NA COLETA INTELIGENTE DE DADOS NA WEB / TEXT MINING AT THE INTELLIGENT WEB CRAWLING PROCESS
This dissertation presents a study about the application of Text Mining as part of the intelligent Web crawling process. The most usual way of gathering data in Web consists of the utilization of web crawlers. Web crawlers are softwares that, once provided with an initial set of URLs (seeds), start the methodical proceeding of visiting a site, store it in di
Publicado em: 2008
-
11. Busca na web e agrupamento de textos usando computação inspirada na biologia / Search in the web and text clustering using computing inspired by biology
A Internet tornou-se um dos principais meios de comunicação da atualidade, reduzindo custos, disponibilizando recursos e informação para pessoas das mais diversas áreas e interesses. Esta dissertação desenvolve e aplica duas abordagens de computação inspirada na biologia aos problemas de otimização do processo de busca e recuperação de informaç
Publicado em: 2007
-
12. Development of techniques based on complex networks for extractive text summarization / Desenvolvimento de técnicas baseadas em redes complexas para sumarização extrativa de textos
Automatic Text Summarization has considerably importance in tasks such as finding and using relevant content in the enormous amount of information available nowadays in digital media. The focus in this field is on the development of techniques that allow someone to obtain the most relevant content of documents, in a condensed way, preserving the original mea
Publicado em: 2007