Uma soluÃÃo em filtragem de informaÃÃo para sistemas de recomendaÃÃo baseada em anÃlise de dados simbÃlicos

AUTOR(ES)
DATA DE PUBLICAÇÃO

2004

RESUMO

Sistemas de RecomendaÃÃo permitem que sites de ComÃrcio EletrÃnico sugiram produtos aos consumidores provendo informaÃÃes relevantes que os ajudem no processo de compra. Para isso à necessÃria 1 a aquisiÃÃo e 2 a adequada utilizaÃÃo do perfil do usuÃrio. O processo de aquisiÃÃo pode ser implÃcito (comprar um livro ou consultar um item em uma loja on-line) ou explÃcito (dar uma nota a um filme ou recomendar um artigo a um amigo). Jà as soluÃÃes propostas para o segundo problema podem ser classificadas em duas categorias principais com relaÃÃo ao tipo de filtragem adotada: Filtragem Baseada em ConteÃdo (baseia-se na anÃlise da correlaÃÃo entre o conteÃdo dos itens com o perfil do usuÃrio) e Filtragem Colaborativa (baseada na correlaÃÃo de perfis de usuÃrios). Tais tÃcnicas possuem limitaÃÃes, como escalabilidade na primeira abordagem e latÃncia na segunda. Contudo, elas sÃo complementares, o que impulsiona o surgimento de filtragens hÃbridas, cujo foco à aproveitar o melhor de cada mÃtodo. Todavia, as filtragens hÃbridas nÃo superam completamente os problemas principais de ambos os mÃtodos. A motivaÃÃo deste trabalho surge do desafio de superar os problemas principais existentes nos mÃtodos de Filtragem Baseada em ConteÃdo. Para isso, o trabalho concentra-se no domÃnio de recomendaÃÃo de filmes, caracterizado por atributos complexos, como sinopse, e no qual predomina uma aquisiÃÃo explÃcita do perfil do usuÃrio. Diante disso, o presente trabalho apresenta um novo mÃtodo de filtragem de informaÃÃo baseado nas teorias de AnÃlise de Dados SimbÃlicos. Na abordagem proposta o perfil à modelado atravÃs de um conjunto de descriÃÃes simbÃlicas modais que sumarizam as informaÃÃes dos itens previamente avaliados. Uma funÃÃo de dissimilaridade que leva em conta as diferenÃas em posiÃÃo e em conteÃdo foi criada a fim de possibilitar a comparaÃÃo entre um novo item e o perfil do usuÃrio. Para avaliar o desempenho deste novo mÃtodo foi modelado um ambiente experimental baseado no EachMovie e definida uma metodologia para avaliaÃÃo dos resultados. Para fins de comparaÃÃo à utilizada a filtragem de informaÃÃo por conteÃdo baseado no algoritmo dos k Vizinhos Mais PrÃximos (kNN). A construÃÃo de um ambiente experimental de avaliaÃÃo do modelo permitiu diagnosticar estatisticamente o melhor desempenho da filtragem baseada em dados simbÃlicos modais, tanto em velocidade quanto em memÃria, com relaÃÃo ao mÃtodo baseado no kNN

ASSUNTO(S)

ciencia da computacao comÃrcio eletrÃnico, personalizaÃÃo, sistemas de recomendaÃÃo, filtragem de informaÃÃo, anÃlise de dados simbÃlicos e-commerce, personalization, recommendation systems, information filtering, symbolic data analysis

Documentos Relacionados