Fast CUDA-based Implementations of Automatic Document Classification Algorithms

Gabriel Ramos, Guilherme Andrade, Felipe Viegas, Leonardo Rocha

Resumo


Com a Web 2.0, observamos um novo cenário: existe mais dados do que podemos analisar e organizá-los é um dos grandes problemas em Ciência da Computação. Existem muitos algoritmos com este propósito, destacando os de Classificação Automática de Documentos (CAD). Muitas propostas visam tornar esses algoritmos computacionalmente viáveis, sendo os melhores resultados obtidos pela paralelização em GPUs (Graphics Processing Units). Neste trabalho apresentamos duas versões paralelas em GPU de algoritmos de CAD, o GPU-NB, baseado no Naïve Bayes, e o G-KNN, baseado no KNN. Mostramos que, além de alcançarem a mesma eficácia,  nossas propostas são mais rápidas que suas versões em CPU.


Texto completo:

PDF


A REIC mudou de endereço! Para acessar as edições publicadas e/ou submeter seu artigo, acesse https://sol.sbc.org.br/journals/index.php/reic.