Redes neurais reversíveis e caracterização de problemas físicos através de programação diferenciável
Visualizar/ Abrir
Data
2023-02-01Primeiro membro da banca
Duzzioni, Eduardo Inacio
Segundo membro da banca
Marchi, Jerusa
Terceiro membro da banca
Ribeiro, Alexandre Dias
Quarto membro da banca
Mombach, José Carlos Merino
Metadata
Mostrar registro completoResumo
Redes neurais reversíveis são um tipo de rede neural onde pode-se recuperar os valores
de entrada conhecendo apenas os valores de saída da rede. Esta tese apresenta
um método para aproximar reversibilidade de redes neurais, onde uma rede neural é treinada
para aproximar os valores de entrada através do gradiente de uma função custo que
depende dos valores da saída. Aplicado em processos gerativos, reversibilidade permite
gerar dados estatisticamente semelhantes ao conjunto de treino. Com uma modificação na
técnica de reversibilidade proposta, é possível tornar local o treinamento de uma rede neural,
permitindo economizar recursos computacionais de memória, que pode ser aplicado
em problemas arbitrários como classificação. Programação diferenciável é um paradigma
de computação onde um programa é construído de blocos diferenciáveis, oferecendo as
vantagens de diferenciabilidade, que pode ser usado para modificar o programa de acordo
com um conjunto de dados e um objetivo, e escalabilidade, onde o programa pode ser executado
em hardware que oferece alta capacidade de paralelismo, como GPU e TPU. Esta
tese apresenta o uso de programação diferenciável para aproximar a solução de equações
diferenciais, demonstrando sua capacidade em auxiliar na solução de problemas físicos
que podem ser representados por este tipo de equação. Outra aplicação de programação
diferenciável desenvolvida em modelos de spin, que podem ser usados para simular uma
variedade de fenômenos como materiais magnéticos, grafos e células biológicas, oferecendo
vantagem de escalabilidade e tempo de execução.
Coleções
Os arquivos de licença a seguir estão associados a este item: