MaterializaÃÃo seletiva de dados baseada em critÃrios de qualidade

AUTOR(ES)
DATA DE PUBLICAÇÃO

2007

RESUMO

Sistemas de integraÃÃo de dados oferecem acesso uniforme a informaÃÃes distribuÃdas em fontes autÃnomas e heterogÃneas, atravÃs de um esquema integrado que compÃe uma visÃo integrada das fontes. Normalmente, duas abordagens podem ser usadas na construÃÃo de sistemas de integraÃÃo de dados, onde cada uma segue uma arquitetura de implementaÃÃo: as abordagens virtual e materializada. Na abordagem virtual, implementada pela arquitetura de mediadores, as informaÃÃes sÃo recuperadas sob demanda diretamente das fontes de dados. Por outro lado, na abordagem materializada (warehousing), implementada pela arquitetura de data warehouse, as informaÃÃes relevantes sÃo recuperadas com antecedÃncia, integradas e armazenadas em um repositÃrio central, comumente chamado de data warehouse, de forma que uma consulta à avaliada diretamente nesse repositÃrio. O sistema de integraÃÃo de dados Integra, em desenvolvimento pelo Centro de InformÃtica da UFPE, combina recursos de ambas as abordagens, com suporte ao processamento de consultas virtuais e materializadas. O Integra foi desenvolvido usando a arquitetura de mediadores (abordagem virtual) com recursos de materializaÃÃo (abordagem materializada), compondo uma abordagem hÃbrida de integraÃÃo de dados. A abordagem hÃbrida à proposta como uma forma de otimizar a performance do sistema de integraÃÃo, uma vez que a inserÃÃo de mecanismos de materializaÃÃo funciona como um mecanismo otimizador no processamento de consultas, alÃm de aumentar a disponibilidade do sistema, principalmente se for feita uma seleÃÃo criteriosa dos dados que serÃo materializados. O objetivo principal deste trabalho à desenvolver e implementar os processos de materializaÃÃo de dados e de manutenÃÃo desses dados materializados, no contexto da proposta definida pelo sistema Integra. A estratÃgia de materializaÃÃo à baseada na seleÃÃo parcial de dados, mediante anÃlise de critÃrios de qualidade e custo, refletindo as caracterÃsticas das fontes e das consultas. Para tal, o processo de materializaÃÃo ainda conta com o desenvolvimento de mÃtodos para estimar os critÃrios. Na arquitetura do sistema Integra, o mÃdulo responsÃvel pela materializaÃÃo e manutenÃÃo dos dados materializados à o Gerenciador do Data Warehouse. Sendo assim, este trabalho visa, tambÃm, o desenvolvimento (funcionalidades) e implementaÃÃo desse mÃdulo

ASSUNTO(S)

data integration system seleÃÃo de dados à materializaÃÃo materialized data maintenance manutenÃÃo de dados materializados data warehouse data selection for materialization sistema de integraÃÃo de dados abordagem e arquitetura hÃbrida critÃrios de qualidade data warehouse quality criteria ciencia da computacao hybrid approach and architecture

Documentos Relacionados