Aprendizado por reforço profundo paralelo aplicado a navegação de drones em três dimensões
Abstract
O trabalho apresentado neste texto consiste em um estudo sobre aprendizado por reforço
profundo aplicado à navegação sem mapa de drones em três dimensões. Para isso, foram utilizados
dois métodos, o D4PG e o DSAC, ambos com capacidade de paralelização e distribuição.
Além disso, foi empregada uma memória priorizada em cada um dos métodos. O drone utilizado
no estudo foi o Hydrone, um drone quadrotor híbrido que atua somente em meio aéreo.
Os métodos foram treinados em ambientes de complexidade variada, desde ambientes sem obstáculos
até ambientes com múltiplos obstáculos em três dimensões. Os resultados apresentaram
uma boa capacidade de aprendizagem dos métodos, que foram capazes de alcançar a grande
maioria dos objetivos propostos. Além disso, a generalização dos métodos foi testada, com
a aplicação destes em ambientes não vistos, o que mostrou que os métodos apresentaram boa
capacidade de generalização. Em resumo, este trabalho apresentou um estudo sobre aprendizado
por reforço profundo aplicado à navegação sem mapa de drones em três dimensões, com
resultados promissores e potenciais aplicações em diversos contextos relacionados à robótica e
à navegação aérea autônoma.
Collections
The following license files are associated with this item: