Modelo de rede neural de múltiplas escalas de tempo aplicado ao robô Dimitri
Abstract
A proposta para a implementação e aplicação do modelo de rede neural recorrente de múltiplas escalas de tempo (MTRNN – Multiple Timescale Recurrent Neural Network) surgiu de experimentos na área de aprendizagem de máquina (Peniak et al. 2011; Nobuta et al. 2011), nos quais um robô humanoide aprende atividades complexas através da interação com humanos. O modelo MTRNN (Yamashita e Tani, 2008) se distingue por possuir dois tipos de unidades principais, os neurônios rápidos e os neurônios lentos. Essa característica da rede a torna capaz de codificar e reproduzir em detalhe fenômenos dinâmicos nos neurônios rápidos e ao mesmo tempo representar estes fenômenos em um grau de abstração mais alto nos neurônios mais lentos, trazendo ideia análoga à intencionalidade das ações observadas em humanos e em outros animais. O objetivo geral do trabalho é a aplicação do modelo MTRNN no robô Dimitri, recentemente desenvolvido no Centro de Tecnologia da UFSM. A rede neural foi implementada em Python, tendo sua implementação iniciada em um trabalho anterior. O treinamento da rede utiliza o algoritmo de aprendizagem Backpropagation Through Time (BPTT) otimizado pelo método de gradiente acelerado de Nesterov. Os dados usados para o treinamento da rede referem-se à posição dos servo-motores ao serem manipulados por um tutor, o qual irá executar movimentos cíclicos. Foram realizados experimentos a fim de testar a rede e suas características. A rede implementada foi capaz de aprender três padrões de movimentos diferentes, mas foi incapaz de operar em malha fechada devido à sensibilidade a distúrbios, sendo assim a rede não está pronta para ser aplicada diretamente no robô Dimitri.