Extração de informação como base para descoberta de conhecimento em dados não estruturados

Autores

  • Rui Gureghian Scarinci UFRGS
  • José Palazzo Moreira de Oliveira UFRGS

Resumo

Métodos de Descoberta de Conhecimento em Texto ou Knowledge Discovery inText - KDT tem sido aplicados a uma grande variedade de domínios, desde artigos paracongressos, até receituários médicos. KDT é o processo de encontrar padrões e informaçõesimplícitas interessantes ou úteis em um corpo de informação textual não estruturado[LOH 97]. Este processo combina muitas das técnicas de Extração de  Informação,Recuperação de Informação, Processamento da Linguagem Natural e Sumarização deDocumentos com os métodos de Data Mining (DM).Os dados estruturados, armazenados na maioria dos Sistemas de Gerência deBancos de Dados, são mais fáceis de serem tratados por meios computacionais, porqueexistem linguagens formais, como SQL e QBE, que permitem sua manipulação e consultade forma mais concisa e precisa [LOH 97]. Os dados não estruturados, por outro lado,necessitam de mecanismos computacionais diferentes dos tradicionalmente usados, paraque possam ser coletados, armazenados, manipulados e consultados. Para aplicar métodostradicionais de DM sobre textos, é necessário impor alguma estrutura para os dados[DIX 97]. Ou seja, alguém deve definir a estrutura destes dados, coletá-los e armazená-losnum Banco de Dados convencional. Entretanto, tal processo necessita de apoioautomatizado, pois é difícil, tedioso e sujeito a erros se feito por pessoas. Neste sentido,Descoberta de Conhecimento em Textos é uma área bastante relacionada com a área de Extração de Informação, bem como a de Recuperação de Informação, e realmente pode-seconsiderar que sistemas de KDT são  construídos a partir de componentes que executam estas tarefas [FEL 99].

Downloads

Não há dados estatísticos.

Downloads

Publicado

2010-07-22

Como Citar

Scarinci, R. G., & Oliveira, J. P. M. de. (2010). Extração de informação como base para descoberta de conhecimento em dados não estruturados. Cadernos De Informática, 1(1), 15–20. Recuperado de https://seer.ufrgs.br/index.php/cadernosdeinformatica/article/view/v1n1p15-20