Comparativo entre o algoritmo de Luhn e o algoritmo GistSumm para sumarização de documentos
DOI:
https://doi.org/10.22456/2175-2745.47524Abstract
Este artigo descreve um comparativo entre dois algoritmos da área de mineração de textos, os quais são utilizados na tarefa de sumarização automática de documentos. Foram comparados nos experimentos o algoritmo clássico de Luhn e o algoritmo GistSumm, sendo realizadas dois tipos de avaliação, ambas utilizando o Português do Brasil como idioma alvo. A primeira consistiu em gerar um resumo de um texto fonte com cada algoritmo,e a avaliação foi conduzida utilizando avaliadores humanos que indicaram a coerência nos resumos de cada um. Por outro lado, a segunda foi conduzida por meio de uma avaliação baseada no resumo, no qual os avaliadores responderam perguntas sobre o texto original possuindo como fonte de consulta somente o resumo gerado pelos algoritmos. Após as análises, foi demonstrado que o algoritmo GistSumm possui maior capacidade para gerar resumos que mantenham a ideia principal do texto, sendo classificado com 81,6% de eficiência no primeiro experimento e 90% no segundo experimento.Downloads
Download data is not yet available.
Downloads
Published
2015-05-04
How to Cite
Muller, E., Granatyr, J., & Lessing, O. R. (2015). Comparativo entre o algoritmo de Luhn e o algoritmo GistSumm para sumarização de documentos. Revista De Informática Teórica E Aplicada, 22(1), 75–94. https://doi.org/10.22456/2175-2745.47524
Issue
Section
Regular Papers