Mapeamento de conhecimento científico: modelagem de tópicos das teses e dissertações do programa de pós-graduação em Ciência da Informação da UFMG

Marcos de Souza, Renato Rocha Souza

Resumo


O uso das ferramentas computacionais tem sido cada vez mais exigido para organizar, recuperar e compreender o crescente volume de dados. A comunicação científica tem contribuído, por meio de trabalhos formais e informais, para esse fenômeno, entretanto, organizar uma grande coleção de documentos pode se tornar humanamente impossível, além de refutável, quando realizada de forma manual. A modelagem de tópicos, por meio de algoritmos de aprendizagem de máquina, tem possibilitado organizar e resumir corpus de dados. A problemática da pesquisa está em descobrir como tem se apresentado os temas das teses e dissertações produzidas pelo Programa de Pós-graduação em Ciência da Informação da Universidade Federal de Minas Gerais. Quanto aos objetivos, busca-se identificar os tópicos de maior relevância do corpus de dados, constituído por documentos do tipo teses e dissertações do PPGCI, tais como os termos e seus respectivos pesos, que constituem cada tópico. Na modelagem de tópicos, utilizou-se o modelo Alocação de Dirichlet Latente, configurado para identificar 6, 8, 10, 12, 14, 16, 18 e 20 tópicos junto ao corpus de dados, que permitiu realizar o mapeamento científico dos documentos analisados. O resultado, com 14 tópicos, apresentou resultados mais coesos e um menor número de ruídos que possibilitou realizar a suposição de nomes dos tópicos de maneira mais assertiva e correlacionar às linhas de pesquisa do PPGCI.


Palavras-chave


Modelagem de tópicos. Aprendizagem de Máquina. Alocação de Dirichlet Latente. Mapeamento Científico. Ciência da Informação.

Texto completo:

PDF


DOI: https://doi.org/10.19132/1808-524500.%25p



Em Questão | ISSN 1808-5245 | EQ no Facebook | EQ no Google Scholar

Classificação Qualis: A2 - Comunicação e Informação; B2 - Ciências Ambientais; B3 - Administração, Ciências Contábeis e Turismo; B4 - Sociologia; B5 - Engenharias I.

Programa de Pós-graduação em Ciência da Informação  | Universidade Federal do Rio Grande do Sul

Rua Ramiro Barcelos, 2705, sala 519 | CEP 90035-007 | Porto Alegre, RS, Brasil | Fone: (51) 3308 2141| E-mail: emquestao @ufrgs.br 

Membro da Associação Brasileira de Editores Científicos 

Signatária do San Francisco Declaration on Research Assessment (DORA)