Luísa: um método de compressão baseado em PPM
Abstract
Ao longo de décadas foram propostos diversos métodos de compressão de dados, cujo
objetivo é transformar símbolos de um arquivo de entrada em códigos binários que ocupem
menos espaço. Um método em especial é denominado PPM (Prediction by Partial Matching).
Este método utiliza informações de contexto para calcular a probabilidade de ocorrência de um
símbolo, e usa codificação entrópica para transformar essa probabilidade em código binário.
Uma das características do PPM é o acoplamento entre a busca de um símbolo dentro de um
contexto e a sua codificação. Esse acoplamento provoca um engessamento que limita a forma
com que a compressão é realizada. Este trabalho propõe o LUÍSA, um novo método de compressão
baseado no PPM. O método inova ao separar a busca do símbolo e a sua codificação,
transformando essas duas etapas em módulos independentes. Essa separação permite que diversas
estratégias sejam usadas, em diferentes aspectos da compressão. O texto apresenta algumas
dessas estratégias, salientando cenários em que sua aplicação seria relevante. Os experimentos
expandem essa análise, demonstrando casos em que o método proposto se destaca em termos
de taxa de compressão, na comparação com PPM e GZip.
Collections
The following license files are associated with this item: