Identificação de predadores sexuais brasileiros em conversas textuais na internet por meio de aprendizagem de máquina

Auteurs

  • Leonardo Ferreira dos Santos Centro Federal de Educação Tecnológica Celso Suckow da Fonseca - CEFET/RJ
  • Gustavo Guedes Centro Federal de Educação Tecnológica Celso Suckow da Fonseca - CEFET/RJ http://orcid.org/0000-0001-8593-1506

Mots-clés :

Pedofilia, PAN-2012, Identificação de predador sexual, Aprendizado de máquina, Redes Neurais Convolucionais, Máquina de vetores de suporte, Árvore de decisão, Naïve Bayes, Florestas Aleatórias, Redes sociais, Conversas virtuais

Résumé

Nos dias de hoje um grande número de crianças e adolescentes tem usado aplicações sociais. De fácil acesso, essas aplicações promovem benefícios e oportunidades. No entanto, ao mesmo tempo, expõem os usuários à diferentes riscos, dentre os quais a atividade predatória sexual. A atividade predatória sexual possui diversas finalidades como a obtenção de pornografia infantil, a extorsão e o abuso sexual. O presente trabalho possui três objetivos principais: (i) criar um conjunto de dados de conversas textuais contendo atividade sexual predatória real para o português do Brasil; (ii) realizar uma análise estatística das conversas textuais presentes nesse conjunto de dados; (iii) realizar uma avaliação experimental considerando os algoritmos de aprendizado de máquina mais populares no domínio da pesquisa com o conjunto de dados construído. Essa avaliação considera a medida de F1 como base. Os resultados alcançados com as contribuições (i) e (ii) possibilitam que novos estudos possam se concentrar na problemática da identificação de predadores sexuais em conversas textuais para o português do Brasil. Os resultados obtidos com a contribuição (iii) evidenciam que as Máquinas de vetores de suporte obtiveram o melhor comportamento, apresentando um resultado de 89.87%.

Téléchargements

Les données relatives au téléchargement ne sont pas encore disponibles.

Téléchargements

Publiée

2020-07-31

Comment citer

Santos, L. F. dos, & Guedes, G. (2020). Identificação de predadores sexuais brasileiros em conversas textuais na internet por meio de aprendizagem de máquina. ISys - Brazilian Journal of Information Systems, 13(4), 22–47. Consulté à l’adresse https://seer.unirio.br/isys/article/view/9394

Numéro

Rubrique

VERSÕES ESTENDIDAS DE ARTIGOS SELECIONADOS