Comparação de algoritmos de aprendizagem de máquina para construir um modelo preditivo para detecção de diabetes não diagnosticada - ELSA-Brasil: estudo de acurácia
AUTOR(ES)
Olivera, André Rodrigues, Roesler, Valter, Iochpe, Cirano, Schmidt, Maria Inês, Vigo, Álvaro, Barreto, Sandhi Maria, Duncan, Bruce Bartholow
FONTE
Sao Paulo Med. J.
DATA DE PUBLICAÇÃO
2017-06
RESUMO
RESUMO CONTEXTO E OBJETIVO: Diabetes tipo 2 é uma doença crônica associada a graves complicações de saúde, causando grande impacto na saúde global. O objetivo foi desenvolver e validar modelos preditivos para detectar diabetes não diagnosticada utilizando dados do Estudo Longitudinal de Saúde do Adulto (ELSA-Brasil) e comparar o desempenho de diferentes algoritmos de aprendizagem de máquina. TIPO DE ESTUDO E LOCAL: Comparação de algoritmos de aprendizagem de máquina para o desenvolvimento de modelos preditivos utilizando dados do ELSA-Brasil. MÉTODOS: Após selecionar 27 variáveis candidatas a partir da literatura, modelos foram construídos e validados em 4 etapas sequenciais: (i) afinação de parâmetros com validação cruzada (10-fold cross-validation); (ii) seleção automática de variáveis utilizando seleção progressiva, estratégia “wrapper” com quatro algoritmos de aprendizagem de máquina distintos e validação cruzada para avaliar cada subconjunto de variáveis; (iii) estimação de erros dos parâmetros dos modelos com validação cruzada; e (iv) teste de generalização em um conjunto de dados independente. Os modelos foram criados com os seguintes algoritmos de aprendizagem de máquina: regressão logística, redes neurais artificiais, naïve Bayes, K vizinhos mais próximos e floresta aleatória. RESULTADOS: Os melhores modelos foram criados utilizando redes neurais artificiais e regressão logística alcançando, respectivamente, 75,24% e 74,98% de média de área sob a curva na etapa de estimação de erros e 74,17% e 74,41% na etapa de teste de generalização. CONCLUSÃO: A maioria dos modelos preditivos produziu resultados semelhantes e demonstrou a viabilidade de identificar aqueles com maior probabilidade de ter diabetes não diagnosticada com dados clínicos facilmente obtidos.
ASSUNTO(S)
aprendizado de máquina supervisionado técnicas de apoio para a decisão mineração de dados modelos estatísticos diabetes mellitus tipo 2
Documentos Relacionados
- Obesidade abdominal no ELSA-Brasil: construção de padrão-ouro latente e avaliação da acurácia de indicadores diagnósticos
- Questionario do ELSA-Brasil: desafios na elaboracao de instrumento multidimensional
- Delineamento e implementacao do biobanco do ELSA-Brasil: estudo prospectivo na populacao brasileira
- Acurácia diagnóstica de um escore de ultrassonografia hepática não invasivo para doença hepática gordurosa não alcoólica (DHGNA) no Estudo Longitudinal de Saúde do Adulto (ELSA-Brasil)
- Consumo de antioxidantes em participantes do ELSA-Brasil: resultados da linha de base