A influência de outliers nos estudos métricos da informação: uma análise de dados univariados

Luís Fernando Maia Lima, Alexandre Masson Maroldi, Dávilla Vieira Odízio da Silva, Carlos Roberto Massao Hayashi, Maria Cristina Piumbato Innocentini Hayashi

Resumo


Este artigo apresenta uma nova fórmula de detecção de outliers via Análise Exploratória de Dados, levando em conta a assimetria dos dados, e também estuda o efeito da remoção dos outliers dos dados originais. Aplica-se a fórmula para três conjuntos de dados publicados na literatura de estudos métricos da informação. O primeiro conjunto de dados apresenta cinco outliers inferiores. A média, dos dados agregados, conduz à falsa impressão de que 40 universidades, de um total de 49, estão acima da média. A remoção dos cinco outliers inferiores conduz a uma nova média em que somente 22 universidades estão acima da média. No segundo conjunto de dados há a presença de cinco outliers inferiores e um outlier superior. Neste caso, o outlier superior ameniza o efeito dos outliers inferiores. No terceiro conjunto de dados, detectam-se cinco outliers superiores e um outlier inferior. A média, dos dados agregados, aponta que dez universidades estão acima da média. Removendo-se os seis outliers dos dados originais, encontra-se que 28 universidades estão acima do novo valor da média. Para os três conjuntos de dados analisados o trabalho também demonstra o efeito dos outliers na estimativa intervalar (inferência estatística): a remoção dos outliers gera valores mais representativos tanto para a média como para o desvio padrão da amostra analisada. Portanto, evidencia-se como outliers podem afetar resultados e conclusões nos estudos métricos da informação. Todavia, a fórmula para a detecção de outliers apresenta-se aberta para futuras pesquisas.


Palavras-chave


Outliers; Univariados; Bibliometria; Assimetria; Análise exploratória de dados

Texto completo:

PDF


DOI: https://doi.org/10.19132/1808-5245240.216-235



Em Questão | ISSN 1808-5245 | EQ no Facebook | EQ no Google Scholar

Classificação Qualis: A2 - Comunicação e Informação; B2 - Ciências Ambientais; B3 - Administração, Ciências Contábeis e Turismo; B4 - Sociologia; B5 - Engenharias I.

Programa de Pós-graduação em Comunicação  | Universidade Federal do Rio Grande do Sul

Rua Ramiro Barcelos, 2705, sala 519 | CEP 90035-007 | Porto Alegre, RS, Brasil | Fone: (51) 3308 2141| E-mail: emquestao @ufrgs.br 

Membro da Associação Brasileira de Editores Científicos 

Signatária do San Francisco Declaration on Research Assessment (DORA)