Um estudo da classificação de emoções em faces parcialmente oclusas
Resumo
Com o aumento do uso de tecnologias ou máquinas inteligentes pelo usuário comum, a necessidade de criação de algoritmos e computadores humano-centrados urge atenção. Nesse sentido, a inferência do estado emocional do ser humano com o qual uma máquina interage é fundamental para o estabelecimento e regulação de conexões afetivas, possuindo aplicações em áreas que vão desde a educação até a de tecnologias assistivas. O uso de algoritmos inteligentes, entretanto, começa a ser regularizado e projetos como a General Data Protection Regulation implicam, para o usuário, o direito à explicação de inferências automatizadas. Este trabalho é enraizado nos dois tópicos citados: estimação de emoção a partir de imagens faciais e explicabilidade do algoritmo inteligente em questão. Para isso, foram comparadas arquiteturas de redes neurais com e sem mecanismos de atenção, treinadas separadamente em dois conjuntos de dados, com e sem a presença de oclusões faciais. Ao fim do estudo, constata-se que a adição de mecanismos de atenção contribui, na maioria dos casos, positivamente para a classificação de emoções. Ainda, o treino com presença de imagens com oclusões parece expandir o foco de uma rede neural em outras imagens de entrada. Para o conjunto CK+, o melhor modelo obteve 97,77% de acurácia quando treinado e validado em imagens sem tarjas e 90,01% quando os dados continham tarjas faciais. No teste de cruzamento de datasets, o melhor modelo de rede neural obteve 44,13% de acurácia para o conjunto JAFFE.
Coleções
Os arquivos de licença a seguir estão associados a este item: