Redes neurais reversíveis e caracterização de problemas físicos através de programação diferenciável

Farias, Tiago de Souza

Visualizar/Abrir

Tese (14.97Mb)

Data

2023-02-01

Autor

Farias, Tiago de Souza

Primeiro orientador

Maziero, Jonas

Primeiro membro da banca

Duzzioni, Eduardo Inacio

Segundo membro da banca

Marchi, Jerusa

Terceiro membro da banca

Ribeiro, Alexandre Dias

Quarto membro da banca

Mombach, José Carlos Merino

Metadata

Mostrar registro completo

Resumo

Redes neurais reversíveis são um tipo de rede neural onde pode-se recuperar os valores de entrada conhecendo apenas os valores de saída da rede. Esta tese apresenta um método para aproximar reversibilidade de redes neurais, onde uma rede neural é treinada para aproximar os valores de entrada através do gradiente de uma função custo que depende dos valores da saída. Aplicado em processos gerativos, reversibilidade permite gerar dados estatisticamente semelhantes ao conjunto de treino. Com uma modificação na técnica de reversibilidade proposta, é possível tornar local o treinamento de uma rede neural, permitindo economizar recursos computacionais de memória, que pode ser aplicado em problemas arbitrários como classificação. Programação diferenciável é um paradigma de computação onde um programa é construído de blocos diferenciáveis, oferecendo as vantagens de diferenciabilidade, que pode ser usado para modificar o programa de acordo com um conjunto de dados e um objetivo, e escalabilidade, onde o programa pode ser executado em hardware que oferece alta capacidade de paralelismo, como GPU e TPU. Esta tese apresenta o uso de programação diferenciável para aproximar a solução de equações diferenciais, demonstrando sua capacidade em auxiliar na solução de problemas físicos que podem ser representados por este tipo de equação. Outra aplicação de programação diferenciável desenvolvida em modelos de spin, que podem ser usados para simular uma variedade de fenômenos como materiais magnéticos, grafos e células biológicas, oferecendo vantagem de escalabilidade e tempo de execução.

URI

http://repositorio.ufsm.br/handle/1/28266

Coleções

Programa de Pós-Graduação em Física [128]

Os arquivos de licença a seguir estão associados a este item:

Creative Commons

Exceto quando indicado o contrário, a licença deste item é descrito como Attribution-NonCommercial-NoDerivatives 4.0 International