Análise de aspectos linguísticos da assistente virtual para reconhecimento de voz Iara
Resumen
O Reconhecimento de Voz (RV) está presente em diversas Inteligências Artificiais (IA).
As IAs auxiliam a vida dos usuários ao fazer algumas tarefas do cotidiano humano,
como ligar aparelhos eletrônicos, enviar mensagens de textos, entre outras. Desde 2018,
no Brasil, a Iara Health, uma startup brasileira, que desenvolveu a IA Iara para auxiliar
o trabalho de profissionais da saúde, médicos radiologistas. A partir de uma análise da
estrutura linguística, especialmente da sílaba, este trabalho propõe-se a analisar os
fatores estruturais que mais impactam o RV da Iara Health, comprometendo seu
desempenho. Verificou-se que as cinco principais estruturas linguísticas não
reconhecidas pela Iara são: onset complexo (com 11 ocorrências); similaridade
fonológica (com 10 ocorrências); coda nasal (com 8 ocorrências); e flexão de número e
epêntese (ambas com 7 ocorrências cada). Na comparação com a Google Assistente, os
resultados indicam que a IA da empresa de tecnologia americana transcreveu de forma
incorreta 143 palavras das 509 totais do corpus dessa pesquisa, o que corresponde a,
aproximadamente, 28% de palavras erradas em todo o corpus. Já a IA da startup
brasileira errou menos de 9% das palavras do corpus.