Aprendizado multi-objetivo de redes RBF e de Máquinas de kernel

AUTOR(ES)
DATA DE PUBLICAÇÃO

2010

RESUMO

Conforme a teoria de aprendizagem estat´stica, o erro de treinamento e a complexidade de modelos de aprendizado devem ser certamente equilibrados para uma generalização válida, além de serem minimizados. Os algoritmos de aprendizagem modernos, tais como máquinas de vetores de suporte, atingem esta meta por meio da regularização e dos métodos de kernel. A sua combinação permite de maneira eficiente analisar e construir máquinas de aprendizagem não-lineares. Nestes algoritmos, devido à não-convexidade do problema de aprendizagem quando o kernel não é fixo, a escolha do kernel é efetuada por meio das técnicas sofisticadas de seleção de modelos, diferentemente da ideia original de equilíbrio entre o erro e a complexidade. Por outro lado, a busca de equilíbrio entre o erro e a complexidade de problemas não-convexos pode ser tratada de maneira multi-objetiva, considerando a aprendizagem supervisionada como o processo de decisão no ambiente de dois objetivos conflitantes. Contudo, métodos modernos de aprendizagem multi-objetiva são voltados á otimização evolucionária, prestando pouca atenção à implementação dos princípios fundamentais de aprendizagem estatística. Neste trabalho foi desenvolvida uma abordagem multi-objetiva de aprendizagem supervisionada baseada na extensão dos conceitos tradicionais, tais como regularização e maximização de margem, aos casos de espaços de hipótese não-convexos, induzidos com múltiplos kernels. No esquema de aprendizagem proposto, as soluções aproximadas dos problemas, geralmente não-convexos, sao obtidos por meio de certa decomposiçao em conjuntos de sub-problemas convexos, nos quais a programação não linear pode ser eficientemente aplicada de maneira determinística. Com o objetivo de implementação do princípio de minimização do risco estrutural, várias medidas de complexidade foram propostas, induzindo os correspondentes algoritmos multiobjetivos. Entretanto, a medida de complexidade baseada em suavidade para as redes de função da base radial (RBF) permitiu a construção de um algoritmo multi-objetivo, com a sua capacidade de definição dos pesos, larguras, centros e quantidades de funções-bases. Em combinação com os critérios de informaçao de Akaike e Bayes, o algoritmo proposto demonstrou um alto desempenho de generalização em vários problemas-testes de natureza diversa. Com o objetivo de extensão do conceito de maximização de margem ao aprendizagem supervisionada com múltiplos kernels, as técnicas de normalização e equalização dos espaços de características foram propostas. As suas análises mostraram a necessidade de formulação de conceito de margem com uma característica mais geral de hiperplano de separação, tal como sua estabilidade. Como resultado, a medida de complexidade baseada no critério de estabilidade desenvolvido, cuja adequação foi confirmada com experimentos, permite a construção de algoritmos multi-objetivos para as classes de kernel arbitrários.

ASSUNTO(S)

engenharia elétrica teses.

Documentos Relacionados