Cosseno de Salton, Índice de Jaccard e Correlação de Pearson: comparando índices normalizados e absolutos em análise de cocitação de autores

Autores

  • Ely Francina Tannuri de Oliveira Universidade Estadual Paulista Julio de Mesquita Filho-UNESP de Marília http://orcid.org/0000-0003-3365-3000
  • Bruno Henrique Alves Universidade Estadual Paulista Julio de Mesquita Filho-UNESP de Marília

DOI:

https://doi.org/10.19132/1808-5245230.235-253

Palavras-chave:

Indicadores normalizados de Cocitação. Cosseno de Salton. Índice de Jaccard. Correlação de Pearson.

Resumo

Esta pesquisa objetiva realizar um estudo comparativo entre os indicadores absolutos e os normalizados, para Análise de Cocitação de Autores, a saber: Cosseno de Salton (CS), Índice de Jaccard (IJ) e Correlação de Pearson (r). , Visa apresentar os três índices normalizados, apontar as diferenças no uso entre os indicadores absolutos e normalizados, avaliar questões sobre a escolha dos três indicadores e apresentar um estudo teórico-aplicado. Ainda, calcular a Correlação de Spearman entre a matriz com os valores absolutos de cocitação e os três diferentes índices normalizados - Cosseno de Salton (CS), Índice de Jaccard (IJ) e Correlação de Pearson (r). Como fonte de dados, utilizaram-se os artigos do periódico Scientometrics, pertencente à base de dados Scopus na temática Estudos Métricos. Recuperaram-se 234 artigos do período de 2013 e 2014, em junho de 2015. Identificaram-se 9.327 pesquisadores citados. Gerou-se a matriz absoluta dos autores mais cocitados e procederam-se às normalizações pelos três processos. No sentido de comparar os resultados da matriz absoluta com os respectivos índices normalizados Cosseno de Salton (CS), Índice de Jaccard (IJ) e Correlação de Pearson (r), calculou-se a Correlação de Spearman, a partir do pareamento dos dados absolutos e dos normalizados de cada uma das matrizes, ordenados em postos, com a finalidade de sugerir o melhor indicador normalizado. Apresentaram-se os gráficos de dispersão e concluiu-se pelo uso de preferencial do Cosseno de Salton (Cs), a partir dos objetivos da pesquisa, da natureza dos dados e da maior significância relativa à Correlação de Spearman.

Downloads

Não há dados estatísticos.

Biografia do Autor

Ely Francina Tannuri de Oliveira, Universidade Estadual Paulista Julio de Mesquita Filho-UNESP de Marília

Livre_Docente na área ;Estudos Bibliométricos Universidade Estadual Paulista Júlio de Mesquita Filho, com doutorado e mestrado em Educação pela Universidade Estadual Paulista Júlio de Mesquita Filho (2001 e 1995). Possui graduação em Pedagogia e graduação em Matemática. Atualmente pertence ao quadro do Programa de Pós-Graduação em Ciência da Informação da Universidade Estadual Paulista Júlio de Mesquita Filho, na linha de Pesquisa Produção e Organização da Informação, ministra a disciplina Estudos Métricos em Informação. É coordenadora do grupo de pesquisa Estudos métricos da Informação; vice coordenadora da linha de pesquisa Produção e Organização da Informação do PPGCI e bolsista pesquisadora do CNPq(2).Tem experiência na área de Matemática e Estatística, com ênfase em Metodologias Quantitativas para a Ciência da Informação, atuando principalmente nos seguintes temas: metodologias estatísticas, estudos métricos, indicadores bibliométricos, avaliação da produção científica e redes de colaboração científica, indicadores absolutos e normalizados, especialmente no âmbito dos Estudos Bibliométricos e Cientométricos.

Bruno Henrique Alves, Universidade Estadual Paulista Julio de Mesquita Filho-UNESP de Marília

Doutorando em Ciência da Informação e bolsista CNPq- Conselho Nacional de Desenvolvimento Científico e Tecnológico, Mestre em Ciência da Informação pelo PPGCI/UNESP/Marília e formado no âmbito da graduação em Biblioteconomia pela Universidade Estadual Paulista Júlio de Mesquita Filho - Campus de Marília (UNESP/Marília). Foi bolsista FAPESP - Fundação de Amparo à Pesquisa do Estado de São Paulo - na Iniciação Científica e no Mestrado. Atualmente também é professor bolsista (Bolsa Didática) pelo Departamento de Ciência da Informação da UNESP-FFC-Marília (2014-2016) nos cursos: Biblioteconomia e Arquivologia. Desenvolve pesquisas, principalmente, nos seguintes temas: Bibliometria, Colaboração Científica, Coautoria, Indicadores Científicos, Sociologia da Ciência e Sociologia de Pierre Bourdieu, desde 2008 participa do Grupo de pesquisa "Estudos Métricos em Informação" da UNESP/Marília.

Referências

AHLGREN, P. et al. Requirements for a Cocitation Similarity Measure, with Special Reference to Pearson’s Correlation Coefficient. Journal of the American Society for Information Science and Technology, North Carolina, v. 54, n. 6, p. 550-560, 2003.

BENSMAN, S. J. Person’s r and author cocitation analysis: a commentary on the controversy. Journal of the American Society of Information Science & Technology, North Carolina, v. 55, n. 10, p. 935-936, 2004.

COORDENAÇÃO DE APERFEIÇOAMENTO DE PESSOAL DE NÍVEL SUPERIOR. Tabelas de áreas do conhecimento. [Brasília, 2012.] Disponível em:<http://www.capes.gov.br/images/stories/download/avaliacao/TabelaAreasConhecimento_072012.pdf>. Acesso em: 30 ago. 2016.

EGGHE, L.; LEYDESDORFF, L. The relation between Pearson’s correlation coefficient r and Salton’s cosine measure. Journal of the American Society for Information Science and Techology, North Carolina, v. 60, n. 5, p. 1027-1036, 2009.

GLÄNZEL, W. Bibliometrics as a research field: a course on theory and application of bibliometric indicators. Bélgica: [s.n.], 2003. Disponível em:

<http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.97.5311&rep=rep1&type=pdf>. Last Accessed: 30 August. 2016.

GLÄNZEL, W. et al. Subfield-specific normalized relative indicators and a new generation of relational charts: methodological foundations illustrated on the assessment of institutional research performance. Scientometrics, Dordrecht, v. 78, n. 1, p. 165-188, 2009.

GMÜR, M. Co-citation analysis and the search for invisible colleges: a methodological evaluation. Scientometrics, Dordrecht, v. 57, n. 1, p. 27-57, 2003.

HAMERS, L. et al. Similarity measures in scientometric research: the Jaccard Index versus Salton´s Cosine formula. Information Processing & Management, Elmsford, v. 25, n. 3, p. 315-318, 1989.

HJØRLAND, B. Domain analysis in information science: eleven approaches traditional as well as innovative. Journal of Documentation, London, v. 58, n. 4, p. 422-462, 2002.

LEYDESDORFF, L.; VAUGHAN, L. Co-occurrence Matrices and their applications in Information Scien¬ce: Extending ACA to the Web environment. Journal of the American Society for Information Science and Technology, North Carolina, v. 57, n. 12, p. 1616-1628, 2006.

LIBERATORE, G.; HERRERO-SOLANA, V.; GUIMARAES, J. A. C. Análise

bibliometrica do periódico brasileiro Ciência da Informação durante o período 2000-2004. Brazilian Journal of Information Science, Marília, v. 1, n. 2, p. 3-21, 2007.

LUUKKONEN, T. et al. The measurement of international scientific collaboration. Scientometrics, Dordrecht, v. 28, n. 1, p. 15-36, 1993.

MOYA ANEGÓN, F.; JIMÉNEZ CONTRERAS, E.; MONEDA CORROCHANO, M. Research fronts in library and information science in Spain (1985-1994). Scientometrics, Dordrecht, v. 42, n. 2, p. 229-246, 1998.

PINHEIRO, L. V. R.; SILVA, G. S. Cartografia histórica e conceitual da

bibliometria/informetria no Brasil. In: CONFERÊNCIA IBERO-AMERICANA DE PUBLICAÇÕES ELETRÔNICAS NO CONTEXTO DA COMUNICAÇÃO CIENTÍFICA (CIPECC), 2., 2008, Rio de Janeiro. Sub-Tema 2–Metrias da comunicação científica: da bibliometria/informetria à Webmetria. Anais eletrônicos...Rio de Janeiro: [s.n.], 2008. Disponível em: <http://ridi.ibict.br/handle/123456789/67>.Acesso em: 30 ago. 2016.

SMALL, H. Co-citation in the scientific literature: a new measure of the relationship between two documents. Journal of the American Society for Information Science, North Carolina, v. 24, n. 4, p. 265-269, 1973.

SMIRAGLIA, R. P. Domain coherence within Knowledge Organization: people, interacting theoretically, across geopolitical and cultural boundaries. In: ANNUAL CAIS/ACSI CONFERENCE, 39, June 2-4, 2011, Canada. Proceedings... Canada: University of New Brunswick, 2011. p. 1-6. Disponível em:<https://journals.library.ualberta.ca/ojs.cais-acsi.ca/index.php/cais-asci/article/view/601/551>. Acesso em: 30 ago. 2016.

VANZ, S. A. S. As redes de colaboração no Brasil (2004-2006). 2009. 204 f. Tese (Doutorado em Comunicação e Informação) – Faculdade de Biblioteconomia e Comunicação, Universidade Federal do Rio Grande do Sul, Porto Alegre, 2009.

WHITE, H. D. Author cocitacion analysis and Pearson’s r. Journal of the American Society of Information Science and Technology, North Carolina, v.54, n.13, p. 1250-1259, 2003.

WHITE, H. D.; GRIFFITH, B. Author co-citation: a literature measure of intellectual structure. Journal of the American Society for Information Science and Technology, North Carolina, v. 32, n. 2, p. 163-171, 1981.

WHITE, H.D.; MCCAIN, K.W. Visualizing a discipline: an author co-citation analysis of Information Science, 1972-1995. Journal of the American Society for Information Science and Technology, North Carolina, v. 49, n. 4, p. 327-355, 1998.

Downloads

Publicado

2017-01-27

Como Citar

TANNURI DE OLIVEIRA, E. F.; ALVES, B. H. Cosseno de Salton, Índice de Jaccard e Correlação de Pearson: comparando índices normalizados e absolutos em análise de cocitação de autores. Em Questão, Porto Alegre, v. 23, p. 235–253, 2017. DOI: 10.19132/1808-5245230.235-253. Disponível em: https://seer.ufrgs.br/index.php/EmQuestao/article/view/67672. Acesso em: 28 mar. 2024.