Automatizando o processo de estimativa de revocação e precisão de funções de similaridade / Automatizing the process of estimating recall and precision of similarity functions
AUTOR(ES)
Santos, Juliana Bonato dos
DATA DE PUBLICAÇÃO
2009
RESUMO
Os mecanismos tradicionais de consulta a bases de dados, que utilizam o critério de igualdade, têm se tornado ineficazes quando os dados armazenados possuem variações tanto ortográficas quanto de formato. Nesses casos, torna-se necessário o uso de funções de similaridade ao invés dos operadores booleanos. Os mecanismos de consulta por similaridade retornam um ranking de elementos ordenados pelo seu valor de similaridade em relação ao objeto consultado. Para delimitar os elementos desse ranking que efetivamente fazem parte do resultado pode-se utilizar um limiar de similaridade. Entretanto, a definição do limiar de similaridade adequado é complexa, visto que este valor varia de acordo com a função de similaridade usada e a semântica dos dados consultados. Uma das formas de auxiliar na definição do limiar adequado é avaliar a qualidade do resultado de consultas que utilizam funções de similaridade para diferentes limiares sobre uma amostra da coleção de dados. Este trabalho apresenta um método automático de estimativa da qualidade de funções de similaridade através de medidas de revocação e precisão computadas para diferentes limiares. Os resultados obtidos a partir da aplicação desse método podem ser utilizados como metadados e, a partir dos requisitos de uma aplicação específica, auxiliar na definição do limiar mais adequado. Este processo automático utiliza métodos de agrupamento por similaridade, bem como medidas para validar os grupos formados por esses métodos, para eliminar a intervenção humana durante a estimativa de valores de revocação e precisão.
ASSUNTO(S)
cluster validity banco : dados recuperacao : informacao clustering métricas : similaridade similarity functions recall precision
ACESSO AO ARTIGO
http://hdl.handle.net/10183/15889Documentos Relacionados
- Avaliação da qualidade de funções de similaridade no contexto de consultas por abrangência
- Análise da influência de funções de distância para o processamento de consultas por similaridade em recuperação de imagens por conteúdo
- Um estudo das funcoes de similaridade da camada limite planetaria
- O processo de recall na indústria automobilística : caracterização, análise e indicadores de desempenho do mercado brasileiro.
- The equitable criminal proceeding and the distinction between the functions of inquiry, accusation and judgment