Identificação do comportamento das hepatites virais a partir da exploração de bases de dados de saúde pública

AUTOR(ES)
DATA DE PUBLICAÇÃO

2005

RESUMO

No Brasil, os órgãos de saúde pública baseiam-se nos Sistemas de Informação em Saúde (SIS) para a formulação de políticas e ações voltadas ao controle e à redução de doenças. Da mesma forma, a Vigilância Epidemiológica (VE) precisa conhecer as doenças e agravos para efetuar o planejamento destas ações de maneira eficiente. O objetivo deste estudo foi identificar o comportamento das Hepatites Virais no Estado do Paraná, contribuindo com informações para a VE. As Hepatites Virais são doenças com o maior número de notificações ao ano nesta localidade e atualmente estão em evidência na Organização Mundial de Saúde (OMS). Apresentam um alto grau de transmissão, incidência e capacidade de cronificação em algumas de suas formas, além do vírus da Hepatite B possuir um potencial de transmissão que pode chegar a ser até 100 vezes maior do que o vírus da AIDS. O SIS que armazena os dados referentes às fichas de investigação das doenças de notificação obrigatória é o Sistema de Informação de Agravos de Notificação (SINAN). Neste sistema no Estado do Paraná, são armazenados dados referentes a 68 doenças e agravos, entre elas as Hepatites Virais. Atualmente, os dados referentes às fichas de investigação (FII) das Hepatites Virais, são pouco explorados, devido à vasta quantidade de fichas e ao número de características existentes, bem como pela falta do uso de tecnologias que possam auxiliar nesta exploração. A descoberta de conhecimento em bases de dados (Knowledge Discovery in Databases - KDD) é uma das tecnologias que pode ser utilizada para auxiliar na análise dados e extração de informações. Geralmente é realizada em três etapas: pré-processamento, mineração de dados e pós-processamento. Neste trabalho, foi utilizada a técnica de classificação para a mineração dos dados, por meio do algoritmo C4.5, a qual permitiu a distinção do comportamento das Hepatites A e B. O algoritmo foi executado seis vezes utilizando a metodologia wrapper. Inicialmente o algoritmo foi aplicado ao maior conjunto de características (65) que pôde ser obtido nas FII, resultando em duas árvores de decisão, uma completa e uma simplificada. Na primeira iteração, a árvore completa utilizou 19 características para distinção das Hepatites e na árvore simplificada, 13. Posteriormente, foram ignoradas as características não utilizadas e aplicou-se novamente o algoritmo. Este processo foi executado ciclicamente até que os atributos utilizados como entrada no algoritmo fizessem parte das estruturas de ambas as árvores. Foi realizada também, uma aplicação deste algoritmo nos atributos explorados rotineiramente pela especialista do Programa Estadual de Prevenção e Controle das Hepatites Virais de forma manual. A análise dos resultados foi efetuada com o auxílio do especialista. Foram confirmados alguns aspectos da literatura, tais como: a Hepatite A tem maior ocorrência em crianças e adultos jovens, a Hepatite B é mais comum em adultos, bem como, a confirmação dos diagnósticos por exames padrões. Outro fato que chamou muito a atenção foi a ocorrência de Hepatites crônicas em pacientes com até 12 anos. Verificou-se também que, por meio da utilização de tecnologias como a KDD, onde os dados são explorados minuciosamente, é possível a identificação de fatores que com outras metodologias não seriam observados.

ASSUNTO(S)

engenharia medica saúde pública - processamento de dados hepatite por vírus - paraná vigilância epidemiológica

Documentos Relacionados