Aplicação do algoritmo DQN a um robô Delta

Lima, Matheus dos Santos

dc.contributor.advisor	Gamarra, Daniel Fernando Tello
dc.creator	Lima, Matheus dos Santos
dc.date.accessioned	2022-11-23T13:43:18Z
dc.date.available	2022-11-23T13:43:18Z
dc.date.issued	2022-11-18
dc.date.submitted	2022
dc.identifier.citation	LIMA, M. dos S. Aplicação do algoritmo DQN a um robô Delta. 2022. 100 p. Trabalho de Conclusão de Curso (Graduação em Engenharia de Controle e Automação)- Universidade Federal de Santa Maria, Santa Maria, RS, 2022	por
dc.identifier.uri	http://repositorio.ufsm.br/handle/1/27068
dc.description	Trabalho de conclusão de curso (graduação) - Universidade Federal de Santa Maria, Centro de Tecnologia, Curso de Engenharia de Controle e Automação, RS, 2022.	por
dc.description.abstract	The present work aims to model the kinematics of a Delta parallel robot and the application of the DQN algorithm in an environment developed based on this model, the agent trained in such environment learns through trial and error, receiving positive rewards when it correctly guesses the next step and negative rewards when it misses. Thus, through the iterative process, the agent develops new policies, that is, new rules on how to take actions given a new state of the environment. A simulation environment whose objective is to correctly position the Delta robot's effector at a given point in space is proposed, this environment consists of an algorithm that uses the mechanism mathematical model to generate renders of the robot every time the agent takes an action. It was possible to obtain 80% of correct answers during training, which can be observed in the rewards graph in the results chapter. With the implementation of the algorithm in the Delta robot environment, it was possible to observe that the implemented solution can solve most of the episodes to which the agent is presented, however, in some specific points, the agent fails to obtain a solution. This usually occurs at singularity points, that is, regions where the mechanism may lose its structural rigidity or fail to obtain a unique solution.	eng
dc.language	por	por
dc.publisher	Universidade Federal de Santa Maria	por
dc.rights	Acesso Embargado	por
dc.rights	Attribution-NonCommercial-NoDerivatives 4.0 International	*
dc.rights	Attribution-NonCommercial-NoDerivatives 4.0 International	*
dc.rights.uri	http://creativecommons.org/licenses/by-nc-nd/4.0/	*
dc.title	Aplicação do algoritmo DQN a um robô Delta	por
dc.title.alternative	Deep reinforcement learning applied to a Delta robot	eng
dc.type	Trabalho de Conclusão de Curso de Graduação	por
dc.degree.local	Santa Maria, RS, Brasil.	por
dc.degree.graduation	Engenharia de Controle e Automação	por
dc.description.resumo	O presente trabalho tem como objetivos a modelagem da cinemática de um robô paralelo Delta e a aplicação do algoritmo DQN em um ambiente desenvolvido com base neste modelo, o agente treinado em tal ambiente aprende por meio de tentativa e erro recebendo recompensas positivas quando acerta e negativas quando erra. Assim, por meio do processo iterativo o agente desenvolve novas políticas, isto é, novas regras sobre como tomar ações dado um novo estado deste ambiente. Um ambiente de simulação cujo objetivo é posicionar corretamente o efetuador do robô Delta em um dado ponto no espaço é proposto, este ambiente consiste em um algoritmo que utiliza o modelo matemático do mecanismo para gerar renderizações do robô toda vez que o agente executa uma nova ação. Foi possível obter 80% de acertos durante o treinamento o que pode ser observado no gráfico de recompensas no capítulo de resultados. Com a implementação do algoritmo no ambiente do robô Delta observou-se que a solução implementada é capaz de resolver a grande maioria dos episódios aos quais o agente é apresentado, no entanto, em alguns pontos específicos, o agente falha em obter uma solução adequada, isso ocorre geralmente em pontos de singularidade, isto é, regiões nas quais o mecanismo pode perder sua rigidez estrutural ou não conseguir obter uma solução única.	por
dc.publisher.country	Brasil	por
dc.publisher.initials	UFSM	por
dc.subject.cnpq	CNPQ::ENGENHARIAS	por
dc.publisher.unidade	Centro de Tecnologia	por

Arquivos deste item

Nome:: Lima_Matheus_dos_Santos_2022_T ...
Tamanho:: 3.759Mb
Formato:: PDF
Descrição:: TCC de Graduação

Visualizar/Abrir

Nome:: license_rdf
Tamanho:: 805bytes
Formato:: application/rdf+xml

Visualizar/Abrir

Este item aparece na(s) seguinte(s) coleção(s)

TCC Engenharia de Controle e Automação [99]
Coleção de trabalhos de conclusão do Curso de Engenharia de Controle e Automação

Mostrar registro simples

Exceto quando indicado o contrário, a licença deste item é descrito como Acesso Embargado