Combinando técnicas não-supervisionadas e supervisionadas para explanação de agrupamentos

Hércules A. Prado, Paulo M. Engel

Resumo


A descoberta de conhecimento a partir de dados não classificados compreende duas tarefas principais: a identificação de "grupos naturais" e a análise destes grupos de modo a interpretar o seu significado. Estas tarefas são realizadas através do aprendizado não-supervisionado e supervisionado, respectivamente, correspondendo também às fases de taxonomia e explanação do processo de descoberta descrito por Langley [LAN 98]. A pesquisa em Descoberta de Conhecimento em Bases de Dados (DCBD) tem atacado estasduas fases segundo duas dimensões: (1) tornando os algoritmos de aprendizado aptos para executar bases de dados cada vez maiores, e (2) facilitando o processo completo de descoberta de conhecimento de maneira análoga ao que fazem as ferramentas CASE com relação à Engenharia de Software. Conforme descrito por Langley, o objetivo principal na descoberta de conhecimento em dados não classificados é a obtenção de descrições de potenciais classes no sub-espaço das dimensões dos objetos. Neste mesmo sentido, Wittgeinstein (op. cit. in [HAN 90]) advoga que os conceitos possuem uma natureza politética, i.e., eles podem ser descritos de muitas formas, compartilhando um número de características comuns, sem que nenhuma delas seja essencial para descrever o conceito. Outros trabalhos como [EAS 85] e [MUR 85] reforçam esta visão do processo dedescoberta de conhecimento de dados não classificados. Pelas referências acima, fica evidente que as duas tarefas - taxonomia e explanação - compõem na verdade um únicoprocesso.

Texto completo:

PDF