Repositório Digital

A- A A+

Um algoritmo de aprendizado por reforço para redes neurais utilizando metaotimização estatística

.

Um algoritmo de aprendizado por reforço para redes neurais utilizando metaotimização estatística

Mostrar registro completo

Estatísticas

Título Um algoritmo de aprendizado por reforço para redes neurais utilizando metaotimização estatística
Outro título A reinforcement learning algorithm for neural networks using statistical meta optimization
Autor Settin, Jorel
Orientador Engel, Paulo Martins
Data 2010
Nível Graduação
Instituição Universidade Federal do Rio Grande do Sul. Instituto de Informática. Curso de Engenharia de Computação.
Assunto Inteligência artificial
Redes neurais
[en] Cascaded neural networks
[en] Evolutionary algorithms
[en] Genetic algorithms
[en] Neural network architecture
[en] Neural network training
[en] Reinforcement learning
[en] Simulated annealing
[en] Statistical meta-optimization.
Resumo Esse trabalho analisa as principais técnicas de treinamento de redes neurais para problemas de aprendizado por reforço, e finalmente propõe um novo modelo utilizando suas melhores características, além de metaotimização baseada em amostragem estatística. O estudo tem por objetivos a obtenção de um método com alta taxa de sucesso, baixo número de simulações do problema, mínima necessidade de prévia especificação de parâmetros de treinamento, adaptabilidade a diversas classes de problemas, ter um comportamento determinístico para obter soluções com a mínima complexidade necessária, e de baixo custo computacional. Compara-se o desempenho do algoritmo proposto às técnicas utilizadas no atual estado da arte, em problemas de controle de sistemas físicos, e outros comumente utilizados como teste de desempenho.
Abstract This work analyzes the main techniques for training neural networks in reinforcement learning problems, and finally proposes a new algorithm using their best features, and besides, utilizing meta-optimization based on statistical sampling. The study aims to obtain a method with a high rate of success, low number of the simulated problem evaluations, minimal needs of prior training parameters specification, adaptability to different problem classes, deterministic behavior for obtaining minimal complexity solutions, and low computational cost. The performance of the new algorithm is compared to the main techniques used in state of the art, in problems of physical system control and other usual benchmarks.
Tipo Trabalho de conclusão de graduação
URI http://hdl.handle.net/10183/27974
Arquivos Descrição Formato
000767659.pdf (1.193Mb) Texto completo Adobe PDF Visualizar/abrir

Este item está licenciado na Creative Commons License

Este item aparece na(s) seguinte(s) coleção(ões)


Mostrar registro completo

Percorrer



  • O autor é titular dos direitos autorais dos documentos disponíveis neste repositório e é vedada, nos termos da lei, a comercialização de qualquer espécie sem sua autorização prévia.
    Projeto gráfico elaborado pelo Caixola - Clube de Criação Fabico/UFRGS Powered by DSpace software, Version 1.8.1.