Mineração em Grandes Massas de Dados Utilizando Hadoop MapReduce e Algoritmos Bio-inspirados: Uma Revisão Sistemática
DOI:
https://doi.org/10.22456/2175-2745.58022Abstract
A Área de Mineração de Dados tem sido utilizada em diversas áreas
de aplicação e visa extrair conhecimento através da análise de dados. Nas últimas
décadas, inúmeras bases de dados estão tendenciando a possuir grande volume, alta
velocidade de crescimento e grande variedade. Esse fenômeno é conhecido como Big
Data e corresponde a novos desafios para tecnologias clássicas como Sistema de Gestão
de Banco de Dados Relacional pois não tem oferecido desempenho satisfatório
e escalabilidade para aplicações do tipo Big Data. Ao contrário dessas tecnologias,
Hadoop MapReduce é um framework que, além de provêr processamento paralelo,
também fornece tolerância a falhas e fácil escalabilidade sobre um sistema de armazenamento
distribuído compatível com cenário Big Data. Uma das técnicas que vem
sendo utilizada no contexto Big Data são algoritmos bio-inspirados. Esses algoritmos
são boas opções de solução em problemas complexos multidimensionais, multiobjetivos
e de grande escala. A combinação de sistemas baseados em Hadoop MapReduce
e algoritmos bio-inspirados tem se mostrado vantajoso em aplicações Big Data. Esse
artigo apresenta uma revisão sistemática de trabalhos nesse contexto, visando analisar
critérios como: tarefas de mineração de dados abordadas, algoritmos bio-inspirados
utilizados, disponibilidade das bases utilizadas e quais características Big Data são
tratadas nos trabalhos. Como resultado, esse artigo discute os critérios analisados e
identifica alguns modelos de paralelização, além de sugerir uma direção para trabalhos
futuros.