A influência de outliers nos estudos métricos da informação: uma análise de dados univariados

Autores

DOI:

https://doi.org/10.19132/1808-5245240.216-235

Palavras-chave:

Outliers, Univariados, Bibliometria, Assimetria, Análise exploratória de dados

Resumo

Este artigo apresenta uma nova fórmula de detecção de outliers via Análise Exploratória de Dados, levando em conta a assimetria dos dados, e também estuda o efeito da remoção dos outliers dos dados originais. Aplica-se a fórmula para três conjuntos de dados publicados na literatura de estudos métricos da informação. O primeiro conjunto de dados apresenta cinco outliers inferiores. A média, dos dados agregados, conduz à falsa impressão de que 40 universidades, de um total de 49, estão acima da média. A remoção dos cinco outliers inferiores conduz a uma nova média em que somente 22 universidades estão acima da média. No segundo conjunto de dados há a presença de cinco outliers inferiores e um outlier superior. Neste caso, o outlier superior ameniza o efeito dos outliers inferiores. No terceiro conjunto de dados, detectam-se cinco outliers superiores e um outlier inferior. A média, dos dados agregados, aponta que dez universidades estão acima da média. Removendo-se os seis outliers dos dados originais, encontra-se que 28 universidades estão acima do novo valor da média. Para os três conjuntos de dados analisados o trabalho também demonstra o efeito dos outliers na estimativa intervalar (inferência estatística): a remoção dos outliers gera valores mais representativos tanto para a média como para o desvio padrão da amostra analisada. Portanto, evidencia-se como outliers podem afetar resultados e conclusões nos estudos métricos da informação. Todavia, a fórmula para a detecção de outliers apresenta-se aberta para futuras pesquisas.

Downloads

Não há dados estatísticos.

Biografia do Autor

Luís Fernando Maia Lima, Fundação Universidade Federal de Rondônia, Departamento de Biblioteconomia.

Vice-Líder do grupo de pesquisa "Cartografia da produção científica da UNIR através de indicadores bibliométricos".

Alexandre Masson Maroldi, Fundação Universidade Federal de Rondônia, Departamento de Biblioteconomia

Líder do Grupo de Pesquisa "Cartografia da produção científica da UNIR através de indicadores bibliométricos".

Dávilla Vieira Odízio da Silva, Instituto Federal do Amazonas

Biblotecária

Referências

ADIL, Iftikhar Hussain; IRSHAD, Ateequr Rehman. A modified approach for detection of outliers. Pakistan Journal of Statistics and Operation Research, Lahore, v. 11, n. 1, p. 91-102, Apr. 2015.

ALVAREZ, Gonzalo Rubén; CAREGNATO, Sônia Elisa. Presença de agradecimentos por financiamento nos artigos brasileiros indexados na Web of Science (2009-2016). In: ENCONTRO BRASILEIRO DE BIBLIOMETRIA E CIENTOMETRIA, 6., 2018, Rio de Janeiro. Anais... Rio de Janeiro: UFRJ, 2018. p. 172-180.

BABURA, Babangida Ibrahim et al. Modified boxplot for extreme data. AIP Conference Proceedings, New York, v. 1842, issue 1, May 2017.

BARNETT, Ofra; COHEN, Ayala. The histogram and boxplot for the display of lifetime data. Journal of Computational and Graphical Statistics, England, v. 9, n. 4, p. 759-778, Dec. 2000.

BARNETT, Vic; LEWIS, Toby. Outliers in statistical data. New York: John Wiley & Sons, 1978.

BUSSAB, Wilton; MORETTIN, Pedro. Estatística Básica. 5. ed. São Paulo: Saraiva, 2002.

CHHIKARA, R. S.; FEIVESON, A. L. Extended critical values of extreme studentized deviate test statistics for detecting multiple outliers. Communications in statistics: simulation and computation, England, v. B9, n. 2, p. 155-166, [s.d.], 1980.

DÜMBGEN, Lutz; RIEDWYL, Hans. On fences and asymmetric in box-and-whiskers plots. The American Statistician, Alexandria, VA, v. 61, n. 4, p. 356-359, Nov. 2007.

HUBERT, Mia; VANDERVIEREN, Ellen. An adjusted boxplot for skewed distributions. Computacional Statistics & Data Analysis, Amsterdam, v. 52, n. 12, p. 5186-5201, Aug. 2008.

KIMBER, A. C. Exploratory data analysis for possibly censored data from skewed distributions. Journal of the Royal Statistical Society. Series C (Applied Statistics), London, v. 39, n. 1, p. 21-30, Jan.1980.

LIMA, Luís Fernando Maia et al. Estudo preliminar sobre a influência de outliers nas métricas científicas para dados univariados. In: ENCONTRO BRASILEIRO DE BIBLIOMETRIA E CIENTOMETRIA, 6., 2018, Rio de Janeiro. Anais... Rio de Janeiro: UFRJ, 2018. p. 446-452.

LIMA, Luís Fernando Maia et al. Proposta de um critério auxiliar para a determinação da elite científica. In: BORGES, Maria Manuel; CASADO, Elias Sanz (Coord.). A ciência aberta: o contributo da Ciência da Informação: atas do VIII Encontro Ibérico EDICIC. Coimbra: Universidade de Coimbra, 2017a. p. 301-310. Disponível em: https://purl.org/sci/atas/edicic2017. Acesso em: 26 ago. 2018.

LIMA, Luís Fernando Maia et al. Métricas científicas em estudos bibliométricos: detecção de outliers para dados univariados. Em Questão, Porto Alegre, v. 23, Edição Especial 5 EBBC, p. 254-273, jan. 2017b.

LIMA, Luís Fernando Maia; MAROLDI, Alexandre Masson; SILVA, Dávilla Vieira Odizio da. Outlier(s) nos cálculos bibliométricos: primeiras aproximações. Liinc em Revista, Rio de Janeiro, v. 9, n. 1, p. 257-268, maio 2013.

PRICE, John Derek de Solla. Little science, big science. New York: Columbia University Press, 1963.

ROSADO, Fernando. Outliers em dados estatísticos. Lisboa: Sociedade Portuguesa de Estatística, 2006.

SILVA, Dávilla Vieira Odizio da; MAROLDI, Alexandre Masson; LIMA, Luís Fernando Maia. Outliers na Lei do Elitismo. Em Questão, Porto Alegre, v. 20, n. 3, Edição Especial, p. 43-59, dez. 2014.

SILVA, Deise Deolindo; ALMEIDA, Cátia Cândida de; GRÁCIO, Maria Claúdia Cabrini. Avaliação científica de periódico em Ciências Sociais: junção dos indicadores Fator de Impacto e índice h. In: ENCONTRO BRASILEIRO DE BIBLIOMETRIA E CIENTOMETRIA, 6., 2018, Rio de Janeiro. Anais... Rio de Janeiro: UFRJ, 2018, p. 264-271.

SILVA, Domingos J. Lopes da. Estatística aplicada à investigação científica nas Ciências do Desporto: análise exploratória de dados com recurso ao SPSS. Medelo, Portugal: Instituto de Estudos Superiores de Fafe, 2011.

SILVA, Fábio Salomão Vinco; SCHULZ, Peter Alexander. Impacto de uma única área de conhecimento sobre os indicadores de um país: a astronomia no Chile. In: ENCONTRO BRASILEIRO DE BIBLIOMETRIA E CIENTOMETRIA, 6., 2018, Rio de Janeiro. Anais... Rio de Janeiro: UFRJ, 2018, p. 181-189.

TAMBAY, J. L. An integrated approach for the treatment of outliers in sub-annual economic surveys. American Statistical Association Proceedings of the Survey Research Methods. Alexandria, VA: American Statistical Association, 1988, p. 229-234.

TRIOLA, Mario F. Introdução à Estatística. 10. ed. Rio de Janeiro: LTC, 2012.

TUKEY, John Wilder. Exploratory Data Analysis. Reading, Massachusetts: Addison-Wesley, 1977.

VANTI, Nadia; CASADO, Elías Sanz. O uso do fator de impacto web alternativo para avaliar as universidades públicas espanholas. In: ARAÚLO, Ronaldo Ferreira de (Org.). Estudos métricos da informação na web: atores, ações e dispositivos. Maceió: EDUFAL, 2015. p. 109-127.

WALKER, Michael; CHAKRABORTI, Subha. An asymmetrically modified boxplot for Exploratory Data Analysis. [S.I.], 2013. Disponível em: https://louisville.edu/sphis/bb/src-2013/student-poster-competition/Abstract_WalkerM.pdf. Acesso em: 25 ago. 2018.

Downloads

Publicado

2018-12-31

Como Citar

MAIA LIMA, L. F.; MAROLDI, A. M.; SILVA, D. V. O. da; HAYASHI, C. R. M.; HAYASHI, M. C. P. I. A influência de outliers nos estudos métricos da informação: uma análise de dados univariados. Em Questão, Porto Alegre, v. 24, p. 216–235, 2018. DOI: 10.19132/1808-5245240.216-235. Disponível em: https://seer.ufrgs.br/index.php/EmQuestao/article/view/86661. Acesso em: 28 mar. 2024.

Edição

Seção

Encontro Brasileiro de Bibliometria e Cientometria

Artigos mais lidos pelo mesmo(s) autor(es)

Artigos Semelhantes

Você também pode iniciar uma pesquisa avançada por similaridade para este artigo.