dc.contributor.advisor | Gamarra, Daniel Fernando Tello | |
dc.creator | Lima, Matheus dos Santos | |
dc.date.accessioned | 2022-11-23T13:43:18Z | |
dc.date.available | 2022-11-23T13:43:18Z | |
dc.date.issued | 2022-11-18 | |
dc.date.submitted | 2022 | |
dc.identifier.citation | LIMA, M. dos S. Aplicação do algoritmo DQN a um robô Delta. 2022. 100 p. Trabalho de Conclusão de Curso (Graduação em Engenharia de Controle e Automação)- Universidade Federal de Santa Maria, Santa Maria, RS, 2022 | por |
dc.identifier.uri | http://repositorio.ufsm.br/handle/1/27068 | |
dc.description | Trabalho de conclusão de curso (graduação) - Universidade Federal de Santa Maria, Centro de Tecnologia, Curso de Engenharia de Controle e Automação, RS, 2022. | por |
dc.description.abstract | The present work aims to model the kinematics of a Delta parallel robot and the application of the DQN algorithm in an environment developed based on this model, the agent trained in such environment learns through trial and error, receiving positive rewards when it correctly guesses the next step and negative rewards when it misses. Thus, through the iterative process, the agent develops new policies, that is, new rules on how to take actions given a new state of the environment. A simulation environment whose objective is to correctly position the Delta robot's effector at a given point in space is proposed, this environment consists of an algorithm that uses the mechanism mathematical model to generate renders of the robot every time the agent takes an action. It was possible to obtain 80% of correct answers during training, which can be observed in the rewards graph in the results chapter. With the implementation of the algorithm in the Delta robot environment, it was possible to observe that the implemented solution can solve most of the episodes to which the agent is presented, however, in some specific points, the agent fails to obtain a solution. This usually occurs at singularity points, that is, regions where the mechanism may lose its structural rigidity or fail to obtain a unique solution. | eng |
dc.language | por | por |
dc.publisher | Universidade Federal de Santa Maria | por |
dc.rights | Acesso Embargado | por |
dc.rights | Attribution-NonCommercial-NoDerivatives 4.0 International | * |
dc.rights | Attribution-NonCommercial-NoDerivatives 4.0 International | * |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/4.0/ | * |
dc.title | Aplicação do algoritmo DQN a um robô Delta | por |
dc.title.alternative | Deep reinforcement learning applied to a Delta robot | eng |
dc.type | Trabalho de Conclusão de Curso de Graduação | por |
dc.degree.local | Santa Maria, RS, Brasil. | por |
dc.degree.graduation | Engenharia de Controle e Automação | por |
dc.description.resumo | O presente trabalho tem como objetivos a modelagem da cinemática de um robô paralelo Delta e a aplicação do algoritmo DQN em um ambiente desenvolvido com base neste modelo, o agente treinado em tal ambiente aprende por meio de tentativa e erro recebendo recompensas positivas quando acerta e negativas quando erra. Assim, por meio do processo iterativo o agente desenvolve novas políticas, isto é, novas regras sobre como tomar ações dado um novo estado deste ambiente. Um ambiente de simulação cujo objetivo é posicionar corretamente o efetuador do robô Delta em um dado ponto no espaço é proposto, este ambiente consiste em um algoritmo que utiliza o modelo matemático do mecanismo para gerar renderizações do robô toda vez que o agente executa uma nova ação. Foi possível obter 80% de acertos durante o treinamento o que pode ser observado no gráfico de recompensas no capítulo de resultados. Com a implementação do algoritmo no ambiente do robô Delta observou-se que a solução implementada é capaz de resolver a grande maioria dos episódios aos quais o agente é apresentado, no entanto, em alguns pontos específicos, o agente falha em obter uma solução adequada, isso ocorre geralmente em pontos de singularidade, isto é, regiões nas quais o mecanismo pode perder sua rigidez estrutural ou não conseguir obter uma solução única. | por |
dc.publisher.country | Brasil | por |
dc.publisher.initials | UFSM | por |
dc.subject.cnpq | CNPQ::ENGENHARIAS | por |
dc.publisher.unidade | Centro de Tecnologia | por |