OtimizaÃÃo de acesso em um sistema de integraÃÃo de dados atravÃs do uso de caching e materializaÃÃo de dados

AUTOR(ES)
DATA DE PUBLICAÇÃO

2003

RESUMO

Sistemas de integraÃÃo de dados oferecem acesso uniforme sobre fontes de dados heterogÃneas e distribuÃdas. Para fornecer um acesso integrado a diversas fontes de dados, duas abordagens clÃssicas foram propostas na literatura atual: abordagem materializada e abordagem virtual. Na abordagem materializada, os dados sÃo previamente acessados, integrados e armazenados em um data warehouse e as consultas submetidas ao sistema de integraÃÃo sÃo processadas nesse repositÃrio sem haver acesso direto Ãs fontes de dados. Na abordagem virtual, as consultas submetidas ao sistema de integraÃÃo sÃo decompostas em subconsultas endereÃadas diretamente Ãs fontes de dados. Os dados obtidos das fontes como resposta a essas subconsultas sÃo integrados e retornados ao usuÃrio solicitante. O nosso trabalho, consiste em criar um ambiente de integraÃÃo de dados provenientes de mÃltiplas fontes no ambiente Web o qual combina recursos de ambas as abordagens suportando o processamento de consultas virtuais e materializadas. Um outro recurso de nossa proposta à a inserÃÃo de um subsistema de gerenciamento de uma cache para armazenar os resultados das consultas mais freqÃentemente submetidas pelo usuÃrio. O ambiente tem recursos de materializaÃÃo de dados em um data warehouse, e o processo de materializaÃÃo à feito seletivamente com base na anÃlise e classificaÃÃo de critÃrios de qualidade e custo associados aos dados das fontes. Essa seleÃÃo criteriosa visa equilibrar melhorias no tempo de resposta das consultas com taxas de custo de manutenÃÃo do data warehouse aceitÃveis. A partir de uma arquitetura de integraÃÃo de dados baseada na abordagem virtual, foram incluÃdos mÃdulos para gerenciamento do data warehouse, gerenciamento da cache e mÃdulos de processamento de consultas sob trÃs formas: virtuais com acesso Ãs fontes de dados, materializadas com acesso ao data warehouse e consultas acessando diretamente a cache. Todos esses recursos sÃo colocados em conjunto visando obter ganhos no desempenho do processamento das consultas no sistema de integraÃÃo

ASSUNTO(S)

gerenciamento de cache data integration systems ciencia da computacao fontes de dados sistema de integraÃÃo de dados cache system data sources data warehouse data warehouse

Documentos Relacionados