Identificação de predadores sexuais brasileiros em conversas textuais na internet por meio de aprendizagem de máquina

Autores

  • Leonardo Ferreira dos Santos Centro Federal de Educação Tecnológica Celso Suckow da Fonseca - CEFET/RJ
  • Gustavo Guedes Centro Federal de Educação Tecnológica Celso Suckow da Fonseca - CEFET/RJ http://orcid.org/0000-0001-8593-1506

Palavras-chave:

Pedofilia, PAN-2012, Identificação de predador sexual, Aprendizado de máquina, Redes Neurais Convolucionais, Máquina de vetores de suporte, Árvore de decisão, Naïve Bayes, Florestas Aleatórias, Redes sociais, Conversas virtuais

Resumo

Nos dias de hoje um grande número de crianças e adolescentes tem usado aplicações sociais. De fácil acesso, essas aplicações promovem benefícios e oportunidades. No entanto, ao mesmo tempo, expõem os usuários à diferentes riscos, dentre os quais a atividade predatória sexual. A atividade predatória sexual possui diversas finalidades como a obtenção de pornografia infantil, a extorsão e o abuso sexual. O presente trabalho possui três objetivos principais: (i) criar um conjunto de dados de conversas textuais contendo atividade sexual predatória real para o português do Brasil; (ii) realizar uma análise estatística das conversas textuais presentes nesse conjunto de dados; (iii) realizar uma avaliação experimental considerando os algoritmos de aprendizado de máquina mais populares no domínio da pesquisa com o conjunto de dados construído. Essa avaliação considera a medida de F1 como base. Os resultados alcançados com as contribuições (i) e (ii) possibilitam que novos estudos possam se concentrar na problemática da identificação de predadores sexuais em conversas textuais para o português do Brasil. Os resultados obtidos com a contribuição (iii) evidenciam que as Máquinas de vetores de suporte obtiveram o melhor comportamento, apresentando um resultado de 89.87%.

Downloads

Não há dados estatísticos.

Downloads

Publicado

2020-07-31

Como Citar

Santos, L. F. dos, & Guedes, G. (2020). Identificação de predadores sexuais brasileiros em conversas textuais na internet por meio de aprendizagem de máquina. ISys - Brazilian Journal of Information Systems, 13(4), 22–47. Recuperado de https://seer.unirio.br/isys/article/view/9394

Edição

Seção

VERSÕES ESTENDIDAS DE ARTIGOS SELECIONADOS