Aprendizado por reforço profundo distribucional paralelo para navegação sem mapa de robôs móveis terrestres
Abstract
Este trabalho apresenta um estudo de técnicas de aprendizagem de reforço profundo que utiliza redes distributivas paralelas de atores-críticos para navegar com robôs móveis terrestres. As abordagens propostas são desenvolvidas levando em conta apenas algumas descobertas de alcance de laser, a posição relativa e o ângulo do robô móvel em relação ao alvo como entradas para fazer um robô alcançar a meta desejada em um ambiente. Foram utilizadas uma estrutura de desenvolvimento sim-to-real, onde os agentes treinados em um simulador de robôs são implantados em cenários reais para melhorar a avaliação. Os resultados obtidos mostram que algoritmos de aprendizagem de reforço profundo de distribuição paralela, com ações contínuas, são eficazes para a tomada de decisão de um veículo robótico terrestre e superam a abordagem clássica de algoritmos baseados em comportamento em termos de velocidade e capacidade de navegação.
Collections
The following license files are associated with this item: