Analysis of the information retrieval process in databases published as linked open data using the RDB2LOD approach

Authors

  • Clayton Martins Pereira Universidade Estadual Paulista (UNESP), Faculdade de Filosofia e Ciências, Marília – SP http://orcid.org/0000-0003-0432-4216
  • Edberto Ferneda Universidade Estadual Paulista (UNESP), Faculdade de Filosofia e Ciências, Marília – SP http://orcid.org/0000-0002-8808-1217
  • José Eduardo Santarem Segundo Universidade de São Paulo, Faculdade de Filosofia Ciências e Letras de Ribeirão Preto. http://orcid.org/0000-0003-3360-7872

DOI:

https://doi.org/10.19132/1808-5245263.94-120

Keywords:

Information retrieval, Relational databases, Linked Data, Linked Open Data, Semantic Web.

Abstract

Linked Open Data has become a standard for data publishing and data enrichment, and it supports the transition from a document-driven Web to an interconnected Web of data and thus to the Semantic Web. On the other hand, relational databases make up the core of most information systems currently in operation due to their maturity and efficiency in the form of storing and querying data. Thus, publishing the vast amount of data maintained in relational databases around the world in line with the good practices and recommendations of Linked Data can contribute significantly to the widespread adoption of Semantic Web tools and technologies. It is in this context that appeared the RDB2LOD approach for publishing Linked Open Data obtained from relational databases. However, once data is effectively published, the next step is efficiently and accurately searching and retrieving it for suitable use. This qualitative and exploratory work aims to analyze the information retrieval process in the RDB2LOD approach, in order to find out if the use of this approach can help to formulate SPARQL queries and, consequently, to improve the visualization and exploration of the retrieved data. For this, a bibliographic and documentary study was carried out, along with an experiment where the RDB2LOD approach’s information retrieval process was evaluated in two different cases. It was demonstrated that the consideration of the semantic aspects of terms in query expressions and the application of ontologies might improve data retrieval efficiency and accuracy.

Downloads

Download data is not yet available.

Author Biographies

Clayton Martins Pereira, Universidade Estadual Paulista (UNESP), Faculdade de Filosofia e Ciências, Marília – SP

Doutorando em Ciência da Informação, área Informação, Tecnologia e Conhecimento, na Universidade Estadual Paulista Júlio de Mesquita Filho (UNESP), onde é membro do Grupo de Pesquisa NEWSDA - Núcleo de Estudos em Web Semântica e Análise de Dados. Mestre em Engenharia Eletrônica e Computação, área Informática, pelo Instituto Tecnológico de Aeronáutica (ITA). Especialização em Gerência de Projetos de Tecnologia da Informação pela Universidade do Sul de Santa Catarina (UNISUL). Exerce o cargo de Analista em C&T (área TI) no Instituto Nacional de Pesquisas Espaciais (INPE), unidade de pesquisas do Ministério da Ciência, Tecnologia, Inovações e Comunicações (MCTIC), onde atua nas áreas de Gestão da Informação e Gestão da Produção Científica. Atualmente é Administrador da Biblioteca Digital e Membro do Comitê Assessor de Tecnologia da Informação do INPE.

Edberto Ferneda, Universidade Estadual Paulista (UNESP), Faculdade de Filosofia e Ciências, Marília – SP

Livre-Docente em Recuperação de Informação (2016). Pós-doutorado pela Universidade Federal da Paraíba (2013). Doutor em Ciências da Comunicação (Ciência da Informação) pela Universidade de São Paulo (2003). Mestre em Informática pela Universidade Federal da Paraíba (1997). Possui graduação em Processamento de Dados pela antiga Fundação Educacional de Bauru (1985). Atualmente é Professor Associado do Departamento de Ciência da Informação da Universidade Estadual Paulista 'Julio Mesquita Filho' (UNESP) - Campus de Marília. Atua na Ciência da Informação, principalmente nas áreas de Indexação Automática e Recuperação de Informação. Bolsista Produtividade em Pesquisa CNPq - Nível 2

José Eduardo Santarem Segundo, Universidade de São Paulo, Faculdade de Filosofia Ciências e Letras de Ribeirão Preto.

Pós-Doutorado pela Faculdade de Engenharia da Computação da Western University/Canadá. Doutor e Mestre em Ciência da Informação pela Universidade Estadual Paulista Júlio de Mesquita Filho-UNESP-Marília/SP; Professor Doutor no Departamento de Educação, Informação e Comunicação, da Faculdade de Filosofia, Ciências e Letras de Ribeirão Preto, da Universidade de São Paulo (USP); Docente do Programa de Pós-Graduação em Ciência da Informação da UNESP/Marília na linha de Informação e Tecnologia. Coordenador do GT8 - Informação e Tecnologia, da Associação Nacional de Pesquisa e Pós-Graduação em Ciência da Informação (ANCIB). Atua na linha de pesquisa - Ambientes Digitais e Tecnologias Aplicadas a Informação e Comunicação - , com ênfase em Web Semântica, Linked Data, Big Data, Aprendizado de Maquina (Machine Learning), Dados Abertos e Acervos Digitais. Lider do NEWSDA - Núcleo de Estudos em Web Semantica e Dados Abertos. Recebeu o Prêmio de Melhor Tese pela Associação Nacional de Pesquisa e Pós-Graduação em Ciência da Informação (ANCIB) - Ano 2011. Recebeu também Menção Honrosa no Prêmio Capes de Teses - 2011 (Ciências Sociais Aplicadas)

References

BERNERS-LEE, T.; HENDLER, J.; LASSILA, O. The semantic Web: a new form of Web content that is meaningful to computers will unleash a revolution of new possibilities. Scientific American, New York, v. 284, p. 28-37, 2001.

CONEGLIAN, C. S. et al. O papel estratégico da Web Semântica no contexto do big data. In: WORKSHOP DE INFORMAÇÃO, DADOS E TECNOLOGIA, 1., 2017, Florianópolis. Anais [...]. Florianópolis: UFSC, 2017. p. 1-6.

CRISTOVÃO, H. M.; FERNANDES, J. H. C. Recuperação de informação em dados ligados: um modelo baseado em mapas conceituais e análise de redes complexas. Transinformação, Campinas, v. 30, n. 2, p. 193-207, 2018.

CUBA RODRÍGUEZ, Y.; OLIVERA BATISTA, D. Los metadatos, la búsqueda y recuperación de información desde las Ciencias de la Información. e-Ciencias de la Información, San José, v. 8, n. 2, p. 3-13, 2018.

DEVI, R.; MEHROTRA, D.; BAAZAOUI-ZGHAL, H. Pubworld - A R2RML mapping driven approach to transform relational database data into shareable format. In: INSTITUTE OF ELECTRICAL AND ELETRONICS ENGINEERS INTERNATIONAL ADVANCE COMPUTING CONFERENCE, 8., 2018, Greater Noida. Proceedings […]. Piscataway: IEEE, 2018. p. 221-227.

FERNÁNDEZ, M. et al. Semantically enhanced Information Retrieval: an ontology-based approach. Journal of Web Semantics, Amsterdam, v. 9, n. 4, p. 434-452, 2011.

FERNEDA, E. Material da disciplina Recuperação de Informação: técnicas e tecnologias. Marília: Unesp, 2019. 1 diapositivo. Acesso em: 6 set. 2019.

GONZALEZ, M.; LIMA, V. L. S. Recuperação de Informação e Processamento da Linguagem Natural. In: CONGRESSO DA SOCIEDADE BRASILEIRA DE COMPUTAÇÃO, 23., 2003, Campinas. Anais [...]. Porto Alegre: SBC, 2003. p. 347-395.

LANTI, D.; XIAO, G.; CALVANESE, D. VIG: Data scaling for OBDA benchmarks. Semantic Web, Amsterdam, v. 10, n. 2, p. 413-433, 2019.

LAUFER, C. Guia de Web semântica. São Paulo: Projeto SPUK, 2015.

LIDDY, E. D. Enhanced Text retrieval using natural language processing. Bulletin of the American Society for Information Science and Technology, New Jersey, v. 24, n. 4, p. 14-16, 1998.

LING, H.; ZHOU, S. Translating relational databases into RDF. In: INTERNATIONAL CONFERENCE ON ENVIRONMENTAL SCIENCE AND INFORMATION APPLICATION TECHNOLOGY, 2., 2010, Wuhan. Proceedings [...]. Piscataway: IEEE, 2010. p. 464-467.

PABÓN, O. S.; GONZÁLEZ, M. E. del S. M. Propuesta para extender semánticamente el proceso de recuperación de información. Escuela de ingenieria de Antioquia, Envigado, v. 11, n. 22, p. 51-65, 2014.

PATEL, A.; JAIN, S. Present and future of semantic web technologies: a research statement. International Journal of Computers and Applications, Abingdon, p. 1-10, 2019.

PEREIRA, C. M. Uma abordagem para a publicação de dados abertos ligados obtidos a partir de bases de dados relacionais. 2012. Dissertação (Mestrado em Informática) - Curso de Pós-Graduação em Engenharia Eletrônica e Computação, Instituto Tecnológico de Aeronáutica, São José dos Campos, 2012.

SANTAREM SEGUNDO, J. E.; CONEGLIAN, C. S. Web semântica e Ontologias: um estudo sobre construção de axiomas e uso de inferências. Informação & Informação, Londrina, v. 21, n. 2, p. 217-244, 2016.

SANTAREM SEGUNDO, J. E. Web semântica: fluxo para publicação de dados abertos e ligados. Informação em Pauta, Fortaleza, v. 3, n. esp., p. 117-140, 2018.

SCHAIBLE, J.; GOTTRON, T.; SCHERP, A. Survey on common strategies of vocabulary reuse in Linked Open Data modeling. In: PRESUTTI, V.; D’AMATO, C.; GANDON, F.; D’AQUIN, M.; STAAB, S.; TORDAI, A. (ed.). ESWC 2014: the Semantic Web: trends and challenges. Berlin: Springer, 2014. p. 457-472 (Lecture Notes in Computer Science, v. 8465).

SILVELLO, G. et al. Semantic representation and enrichment of information retrieval experimental data. International Journal of Digital Libraries, Berlin, v. 18, p. 145-172, 2017.

ULUTAŞ KARAKOL, D. et al. Semantic linking spatial RDF data to the web data sources. International Archives of Photogrammetry and Remote Sensing Spatial Information Science, Delft, v. XLII-4, p. 639-645, 2018.

Published

2020-09-16

How to Cite

MARTINS PEREIRA, C.; FERNEDA, E.; SANTAREM SEGUNDO, J. E. Analysis of the information retrieval process in databases published as linked open data using the RDB2LOD approach. Em Questão, Porto Alegre, v. 26, n. 3, p. 94–120, 2020. DOI: 10.19132/1808-5245263.94-120. Disponível em: https://seer.ufrgs.br/index.php/EmQuestao/article/view/98764. Acesso em: 24 jun. 2025.

Issue

Section

Article

Most read articles by the same author(s)