Avaliação de Desempenho de Métodos de Classificação Aplicados na Identificação de Spam Hosts

Autores

  • Renato Moraes Silva Universidade Estadual de Campinas
  • Alex Garcia Vaz Universidade Federal de São Carlos (UFSCar)
  • Tiago Agostinho Almeida Universidade Federal de São Carlo
  • Akebo Yamakami Universidade Estadual de Campinas (UNICAMP)

Resumo

A web vem se tornando cada vez mais importante para seus usuários, tanto como fonte de diversão, comunicação, pesquisa, notícias e comércio. Consequentemente, os sites concorrem entre si para atrair a atenção dos usuários, sendo que muitos ganham maior visibilidade através de estratégias que enganam os motores de busca. Esses sites, conhecidos como web spam, causam prejuízos pessoais e econômicos aos usuários. Diante desse cenário, este trabalho apresenta uma análise de desempenho de diversas técnicas de aprendizagem de máquina aplicadas na detecção automática de servidores web que propagam web spam. Por meio de uma validação estatística dos resultados observou-se as técnicas de bagging de árvores de decisão, redes neurais perceptron de múltiplas camadas, floresta aleatória e boosting adaptativo de árvores de decisão são promissoras na tarefa de detecção de spam hosts.

Downloads

Não há dados estatísticos.

Biografia do Autor

Renato Moraes Silva, Universidade Estadual de Campinas

Possui graduação em Licenciatura Plena em Informática pela Universidade Federal de Mato Grosso (2009). Atualmente está cursando mestrado em Engenharia Elétrica pela Faculdade de Engenharia Elétrica e Computação (FEEC) da Universidade Estadual de Campinas (UNICAMP). Está vinculado ao Departamento de Telemática (DT)

Alex Garcia Vaz, Universidade Federal de São Carlos (UFSCar)

Aluno de graduação do curso de Ciência da Computação da Universidade Federal de São Carlos (UFSCar) e bolsista de Iniciação Científica do CNPq.

Tiago Agostinho Almeida, Universidade Federal de São Carlo

Possui doutorado em Engenharia Elétrica pela Universidade Estadual de Campinas. Atualmente é professor adjunto do Departamento de Computação da Universidade Federal de São Carlos (UFSCar), campus Sorocaba e pesquisador colaborador da Faculdade de Engenharia Elétrica e de Computação da UNICAMP

Akebo Yamakami, Universidade Estadual de Campinas (UNICAMP)

Possui doutorado em Engenharia Elétrica pela Universidade Estadual de Campinas. Atualmente é professor MS-6 da Faculdade de Engenharia Elétrica e Computação (FEEC) da Universidade Estadual de Campinas (UNICAMP). Está vinculado ao Departamento de Telemática (DT).

Downloads

Publicado

2013-04-29

Como Citar

Silva, R. M., Vaz, A. G., Almeida, T. A., & Yamakami, A. (2013). Avaliação de Desempenho de Métodos de Classificação Aplicados na Identificação de Spam Hosts. ISys - Brazilian Journal of Information Systems, 5(1). Recuperado de https://seer.unirio.br/isys/article/view/2204

Edição

Seção

ARTIGOS REGULARES