Minerando Regras de Associação de Multirrelação na Web de Dados

Autores

Palavras-chave:

Mineração de regras de associação de multirrelação, Web de Dados, Mineração de Dados em Grafos, Mineração de Dados

Resumo

A Web de Dados é uma relevante e crescente fonte de dados que contém informações distribuídas em diferentes datasets interligados. A maioria dos algoritmos de mineração de dados foi projetada para analisar um único dataset por vez, e, consequentemente, não consegue explorar as conexões entre datasets da Web de Dados. Para suprir essa lacuna, este trabalho propõe o MRAR+, um algoritmo de mineração de grafos que busca por regras de associação multirrelação a fim de identificar conhecimentos novos que envolvam recursos de múltiplos datasets da Web de Dados. O MRAR+ foi aplicado com sucesso em dois experimentos e produziu regras novas e úteis para os usuários, ilustrando a sua viabilidade para minerar diferentes datasets interligados na Web de Dados.

Downloads

Biografia do Autor

Felipe Alves de Oliveira, Instituto Militar de Engenharia (IME)

Possui mestrado em ciências em sistemas e computação pelo Instituto Militar de Engenharia (2018) e graduação em Sistema de Informação pela Universidade Estácio de Sá (2014). Atualmente é analista de aplicações web pleno da Central IT Governança Corporativa. Tem experiência na área de Ciência da Computação, com ênfase em mineração e análise de dados, atuando principalmente nos seguintes temas: sistemas de informação, banco de dados, data mining e coleções biológicas. Certificações: ITIL v3 Foundation, ISO 27001 Foundation e Scrum Fundamentals. Recentemente concluí o curso de administração de banco de dados com alta performance.

Raquel Lopes Costa, Instituto Nacional do Câncer (INCA)

Doutora e mestre em modelagem computacional pelo Laboratório Nacional de Computação Científica, LNCC, Rio de Janeiro (CAPES 6). Possui graduação em ciências biológicas, nas modalidades de licenciatura e bacharelado, pela Universidade Federal de Ouro Preto - UFOP, Minas Gerais. Linhas de pesquisa de interesse: Abordagens computacionais multi-ômicas na reconstrução de redes de interações gênicas; Redes de interações gênicas oncovirais; Biodiversidade e Metagenômica; Banco de dados (relacionais e grafos) e e-science (Workflows, HPC, Big data) aplicados em bioinformática e biologia computacional.

Ronaldo Ribeiro Goldschmidt, Instituto Militar de Engenharia (IME)

Possui graduação em Matemática pela Universidade Federal Fluminense, mestrado em Sistemas e Computação pelo Instituto Militar de Engenharia e doutorado em Engenharia Elétrica - Métodos de Apoio à Decisão - pela Pontifícia Universidade Católica do Rio de Janeiro. Atua como docente há mais de vinte anos, tendo lecionado tanto em instituições públicas (Instituto Superior de Tecnologia do Rio de Janeiro da rede FAETEC e Universidade Federal Rural do Rio de Janeiro) quanto em particulares (Universidade da Cidade do Rio de Janeiro, Universidade Gama Filho e Faculdades Integradas de Jacarepaguá). Durante mais de quinze anos ocupou cargos de chefia de departamento e coordenação de cursos e de núcleos de pesquisa e extensão em algumas dessas instituições. Além disso, gerenciou diversos projetos de desenvolvimento de sistemas de informação nas áreas financeira e educacional. Prestou consultoria na concepção e implantação de sistemas de apoio à decisão em análise de crédito e cobrança em empresas tais como Banco do Brasil, Bradesco, Banco da Amazônia, Banco da Bahia, Unibanco, Fininvest, dentre outras. Atualmente é professor associado ao Instituto Militar de Engenharia. Tem experiência e especial interesse em pesquisas e aplicações envolvendo Métodos de Apoio à Decisão, Inteligência Artificial e Ciência de Dados. Publicou mais de oitenta artigos em conferências e periódicos, além de seis livros técnicos.

Maria Cláudia Cavalcanti, Instituto Militar de Engenharia (IME)

Possui mestrado (1994) e doutorado (2003) em Engenharia de Sistemas e Computação pela COPPE Sistemas/UFRJ, e graduação em Informática (1988) pelo Instituto de Matemática da UFRJ. Atualmente é Professor Titular do Instituto Militar de Engenharia (IME). Tem experiência na área de Ciência da Computação, com ênfase em Banco de Dados, atuando principalmente nos seguintes temas: metadados, interoperabilidade de dados, Web semântica, proveniência de dados, anotação de textos e bioinformática.

Referências

Acibar, J., Aguanta, L., Gomora, J., and Velasco, L. (2016). Data analysis with visualization for a geographic information system of schistosomiasis community health data. In Pre-proceeding of the 6th Workshop on Computation: Theory and Practice WCTP.

Agrawal, R., Imieli´nski, T., and Swami, A. (1993). Mining association rules between sets of items in large databases. SIGMOD Rec., 22(2):207–216.

Ait-Mlouk, A., Jiang, L., and Vu, X.-S. (2019). Improving rdf data through semantic association rules mining. In 31st Sweedish AI Society Workshop (SAIS 2019).

Barati, M. (2019). Automated Knowledge Enrichment for SemanticWeb Data. PhD thesis, School of Engineering, Computer and Mathematical Sciences, Auckland University of Technology, Auckland, New Zealand.

Barati, M., Bai, Q., and Liu, Q. (2017). Mining semantic association rules from RDF data. Knowl.-Based Syst., 133:183–196.

Basse, A., Gandon, F., Mirbel, I., Lo, M., Mirbel, I., and Fr (2010). Dfs-based frequent graph pattern extraction to characterize the content of rdf triple stores.

Berners-Lee, T., Hendler, J., and Lassila, O. (2001). The semantic web. Scientific american, 284(5):34–43.

Bizer, C., Heath, T., and Berners-Lee, T. (2009). Linked data-the story so far. Int. journal

on Semantic Web and Information Systems, 5(3):1–22.

Bizer, C., Heath, T., Idehen, K., and Berners-Lee, T. (2008). Linked data on the web (ldow2008). In Proceedings of the 17th Int. Conf. on World Wide Web, WWW ’08, pages 1265–1266, New York, NY, USA. ACM.

Bytyc¸i, E., Ahmedi, L., and Kurti, A. (2016). Association rule mining with context ontologies: An application to mobile sensing of water quality. In Garoufallou, E., Subirats Coll, I., Stellato, A., and Greenberg, J., editors, Metadata and Semantics Research, pages 67–78, Cham. Springer International Publishing.

de Oliveira, F. A., Costa, R. L., Goldschmidt, R. R., and Cavalcanti, M. C. (2019). Multirelation association rule mining on datasets of the web of data. In Proceedings of the XV Brazilian Symposium on Information Systems, SBSI 2019, Aracaju, Brazil, May 20-24, 2019, pages 61:1–61:8.

Elseidy, M., Abdelhamid, E., Skiadopoulos, S., and Kalnis, P. (2014). Grami: Frequent subgraph and pattern mining in a single large graph. volume 7, pages 517–528.

Fayyad, U., Piatetsky-Shapiro, G., and Smyth, P. (1996). From data mining to knowledge discovery in databases. AI magazine, 17(3):37.

Goldschmidt, R., Bezerra, E., and Passos, E. (2015). Data Mining: Conceitos, técnicas, algoritmos, orientações e aplicações. Rio de Janeiro: Elsevier.

Hendrickx, T., Cule, B., Meysman, P., Naulaerts, S., Laukens, K., Goethals, B.”, e. T., Lim, E., Zhou, Z., Ho, T., Cheung, D., and Motoda, H. (2015). Mining Association Rules in Graphs Based on Frequent Cohesive Itemsets, pages 637–648. Springer Int. Publishing, Cham.

Natali, V. and Alfadian, P. (2019). Analisis dan perancangan domain specific language untuk data generator pada relational database. JUMANJI (Jurnal Masyarakat Informatika Unjani), 3(01):64–73.

Oliveira, F. A. (2018). Mineração de regras de associação de multirrelação em datasets na web de dados. Master’s thesis, Instituto Militar de Engenharia(IME), Rio de Janeiro.

Oliveira, F. A., Costa, R. L., Goldschmidt, R. R., and Cavalcanti, M. C. (2017). Mineração de regras de associação multirrelação em grafos: Direcionando o processo de busca. In Simpósio Brasileiro de Banco de Dados (SBBD’17), pages 270–275.

Pickler, M. E. V. (2007). Web semântica: ontologias como ferramentas de representação do conhecimento. Perspectivas em Ciência da Inf., 12(1):65–83.

Raad, J., Beek, W., van Harmelen, F., Pernelle, N., and Saïs, F. (2018). Detecting erroneous identity links on the web using network metrics. In Vrandeˇci´c, D., Bontcheva, K., Suárez-Figueroa, M. C., Presutti, V., Celino, I., Sabou, M., Kaffee, L.-A., and Simperl, E., editors, The Semantic Web – ISWC 2018, pages 391–407, Cham. Springer International Publishing.

Ramezani, R., Saraee, M., and Nematbakhsh, M. A. (2014). MRAR : Mining Multi-Relation Association Rules. J. of Computing and Security, 1(2):133–158.

Rehman, S. U., Khan, A. U., and Fong, S. (2012). Graph mining: A survey of graph mining techniques. In Seventh International Conference on Digital Information Management (ICDIM 2012), pages 88–92.

Sydow, M., Pikuła, M., and Schenkel, R. (2013). The notion of diversity in graphical entity summarisation on semantic knowledge graphs. J Intell Inf Syst, 41:109–149.

Tavares, A., Oliveira, H., and Lóscio, B. (2015). Rdfmat–um serviço para criação de repositórios de dados rdf a partir de crawling na web de dados. Revista da Escola Regional de Informática, 1(1):6.

Vieira, M. R., FIGUEIREDO, J. M. d., Liberatti, G., and Viebrantz, A. F. M. (2012). Bancos de dados nosql: conceitos, ferramentas, linguagens e estudos de casos no contexto de big data. Simpósio Brasileiro de Bancos de Dados, 27:1–30. 27/12/2017.

Zhang, X., Zhao, C., Wang, P., and Zhou, F. (2012). Mining link patterns in linked data. Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics), 7418 LNCS:83–94. cited By 10.

Downloads

Publicado

2020-07-31

Como Citar

Oliveira, F. A. de, Villote, G. dos S., Costa, R. L., Goldschmidt, R. R., & Cavalcanti, M. C. (2020). Minerando Regras de Associação de Multirrelação na Web de Dados. ISys - Brazilian Journal of Information Systems, 13(4), 77–100. Recuperado de https://seer.unirio.br/isys/article/view/9557

Edição

Seção

VERSÕES ESTENDIDAS DE ARTIGOS SELECIONADOS