Sumarizando informações na web através da identificação de tendências
Resumo
Uma área de pesquisa que vem conquistado espaço é a descoberta de tendências a partir
de dados disponibilizados na Web, ou seja, a descoberta de assuntos que despertem maior atenção
por parte de usuários Web. Alguns trabalhos nessa área realizam o processo de descoberta
usando técnicas relativamente complexas baseadas em aprendizado de máquina ou usando um
volume grande de dados obtidos de bases de dados internas. O objetivo deste trabalho é demonstrar
que é possível descobrir assuntos de pertinência através de implementações simples,
analisando uma quantidade baixa de informações. Para isso, o trabalho propõe uma ferramenta
chamada SE Trends (Search Engine Trends), que delega a parte mais onerosa do processamento
a um motor de busca. A ferramenta aplica técnicas de recuperação de informação sobre páginas
retornadas a partir de consultas efetuadas em um motor de busca. Cada termo encontrado
é classificado quanto à sua importância, e termos mais bem classificados são considerados os
assuntos mais relevantes. Os experimentos demonstram cenários em que o SE Trends retorna
termos que realmente estão associados a assuntos de relevância nacional.
Coleções
Os arquivos de licença a seguir estão associados a este item: