Mostrar registro simples

dc.contributor.advisorGamarra, Daniel Fernando Tello
dc.creatorLima, Matheus dos Santos
dc.date.accessioned2022-11-23T13:43:18Z
dc.date.available2022-11-23T13:43:18Z
dc.date.issued2022-11-18
dc.date.submitted2022
dc.identifier.citationLIMA, M. dos S. Aplicação do algoritmo DQN a um robô Delta. 2022. 100 p. Trabalho de Conclusão de Curso (Graduação em Engenharia de Controle e Automação)- Universidade Federal de Santa Maria, Santa Maria, RS, 2022por
dc.identifier.urihttp://repositorio.ufsm.br/handle/1/27068
dc.descriptionTrabalho de conclusão de curso (graduação) - Universidade Federal de Santa Maria, Centro de Tecnologia, Curso de Engenharia de Controle e Automação, RS, 2022.por
dc.description.abstractThe present work aims to model the kinematics of a Delta parallel robot and the application of the DQN algorithm in an environment developed based on this model, the agent trained in such environment learns through trial and error, receiving positive rewards when it correctly guesses the next step and negative rewards when it misses. Thus, through the iterative process, the agent develops new policies, that is, new rules on how to take actions given a new state of the environment. A simulation environment whose objective is to correctly position the Delta robot's effector at a given point in space is proposed, this environment consists of an algorithm that uses the mechanism mathematical model to generate renders of the robot every time the agent takes an action. It was possible to obtain 80% of correct answers during training, which can be observed in the rewards graph in the results chapter. With the implementation of the algorithm in the Delta robot environment, it was possible to observe that the implemented solution can solve most of the episodes to which the agent is presented, however, in some specific points, the agent fails to obtain a solution. This usually occurs at singularity points, that is, regions where the mechanism may lose its structural rigidity or fail to obtain a unique solution.eng
dc.languageporpor
dc.publisherUniversidade Federal de Santa Mariapor
dc.rightsAcesso Embargadopor
dc.rightsAttribution-NonCommercial-NoDerivatives 4.0 International*
dc.rightsAttribution-NonCommercial-NoDerivatives 4.0 International*
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/4.0/*
dc.titleAplicação do algoritmo DQN a um robô Deltapor
dc.title.alternativeDeep reinforcement learning applied to a Delta roboteng
dc.typeTrabalho de Conclusão de Curso de Graduaçãopor
dc.degree.localSanta Maria, RS, Brasil.por
dc.degree.graduationEngenharia de Controle e Automaçãopor
dc.description.resumoO presente trabalho tem como objetivos a modelagem da cinemática de um robô paralelo Delta e a aplicação do algoritmo DQN em um ambiente desenvolvido com base neste modelo, o agente treinado em tal ambiente aprende por meio de tentativa e erro recebendo recompensas positivas quando acerta e negativas quando erra. Assim, por meio do processo iterativo o agente desenvolve novas políticas, isto é, novas regras sobre como tomar ações dado um novo estado deste ambiente. Um ambiente de simulação cujo objetivo é posicionar corretamente o efetuador do robô Delta em um dado ponto no espaço é proposto, este ambiente consiste em um algoritmo que utiliza o modelo matemático do mecanismo para gerar renderizações do robô toda vez que o agente executa uma nova ação. Foi possível obter 80% de acertos durante o treinamento o que pode ser observado no gráfico de recompensas no capítulo de resultados. Com a implementação do algoritmo no ambiente do robô Delta observou-se que a solução implementada é capaz de resolver a grande maioria dos episódios aos quais o agente é apresentado, no entanto, em alguns pontos específicos, o agente falha em obter uma solução adequada, isso ocorre geralmente em pontos de singularidade, isto é, regiões nas quais o mecanismo pode perder sua rigidez estrutural ou não conseguir obter uma solução única.por
dc.publisher.countryBrasilpor
dc.publisher.initialsUFSMpor
dc.subject.cnpqCNPQ::ENGENHARIASpor
dc.publisher.unidadeCentro de Tecnologiapor


Arquivos deste item

Thumbnail
Thumbnail

Este item aparece na(s) seguinte(s) coleção(s)

Mostrar registro simples

Acesso Embargado
Exceto quando indicado o contrário, a licença deste item é descrito como Acesso Embargado