Método de normalização de sintagmas nominais na indexação automática

Renato Fernandes Corrêa, Victor Galvão Celerino

Resumo


Propõe e avalia um método de normalização de sintagmas nominais em termos canônicos, que visa contribuir para a melhora qualitativa da indexação automática, evitando a dispersão terminológica e preservando as palavras-chave dos autores, presentes no interior dos sintagmas nominais. A pesquisa é exploratória e empírica, pautada em pesquisa bibliográfica e realização de um experimento em um corpus de artigos científicos da área de Ciência da Informação. O método proposto é constituído por regras e critérios de normalização que obedecem às restrições de preservação da estrutura válida do sintagma nominal e das palavras-chave. O método proposto é avaliado através da presença de termos do Tesauro Brasileiro em Ciência da Informação (TBCI) nos sintagmas nominais resultantes da aplicação das regras e critérios. O método consiste em duas etapas: a primeira é composta por 85 regras para minimizar os sintagmas nominais extensos; a segunda etapa é composta por sete critérios responsáveis por eliminar dos sintagmas nominais elementos gramaticais desnecessários em sua estrutura. Os resultados da avaliação indicam que o método de normalização permite o alcance de resultados positivos, mesmo com dois critérios da segunda etapa não apresentando resultados para o corpus utilizado. Conclui-se que a aplicação do método de normalização em sistema de indexação automática é viável e traz bons resultados.


Palavras-chave


Indexação automática. Sintagmas nominais. Normalização de sintagmas nominais. Palavras-chave. Tesauro.

Texto completo:

PDF


DOI: https://doi.org/10.19132/1808-5245251.321-344



Em Questão | ISSN 1808-5245 | EQ no Facebook | EQ no Google Scholar

Classificação Qualis: A2 - Comunicação e Informação; B2 - Ciências Ambientais; B3 - Administração, Ciências Contábeis e Turismo; B4 - Sociologia; B5 - Engenharias I.

Programa de Pós-graduação em Comunicação  | Universidade Federal do Rio Grande do Sul

Rua Ramiro Barcelos, 2705, sala 519 | CEP 90035-007 | Porto Alegre, RS, Brasil | Fone: (51) 3308 2141| E-mail: emquestao @ufrgs.br 

Membro da Associação Brasileira de Editores Científicos 

Signatária do San Francisco Declaration on Research Assessment (DORA)