Comparação de algoritmos de aprendizagem por reforço profundo na navegação do robô móvel e desvio de trajetória
Resumen
Este trabalho apresenta um estudo de duas abordagens de Deep Reinforcement Learning (Deep-RL) para melhorar o problema de navegação sem mapa para um robô móvel terrestre. A metodologia foca na comparação de uma técnica Deep-RL baseada no algoritmo Deep Q-Network (DQN) com uma segunda baseada no algoritmo Double Deep Q-Network (DDQN). Foram utilizadas 24 leituras do laser, a posição relativa e o ângulo do agente em relação ao alvo como informações para o agente, que fornecem as ações como velo- cidades para o robô. Ao usar uma estrutura de aprendizado de sensoriamento de baixa dimensão como a proposta, mostra-se que é possível treinar um agente com sucesso para realizar tarefas relacionadas à navegação e evitar obstáculos sem o uso de informações de sensoriamento complexas, como em abordagens baseadas em imagens. A metodologia proposta foi utilizada com sucesso em três ambientes distintos reais e simulados. Assim, foi mostrado que as estruturas Double Deep melhoram ainda mais o problema para a navegação de robôs móveis quando comparados aos de estruturas Q simples.
Colecciones
El ítem tiene asociados los siguientes ficheros de licencia: