Análise Empírica de Desempenho de Quatro Métodos de Seleção de Características para Random Forests

Denise Gasques Bastos; Patricia Santos Nascimento; Marcelo de Souza Lauretto

Análise Empírica de Desempenho de Quatro Métodos de Seleção de Características para Random Forests

Autores

Denise Gasques Bastos Universidade de São Paulo
Patricia Santos Nascimento Universidade Federal do Espírito Santo
Marcelo de Souza Lauretto Universidade de São Paulo

Resumo

Em aprendizado supervisionado, é comum a ocorrência de bases de dados contendo atributos irrelevantes. Sob tais circunstâncias, a adoção de critérios de seleção de características relevantes para a classificação é fundamental, principalmente nos problemas em que os custos de coleta de dados são proporcionais à quantidade de atributos. Neste artigo, são apresentados dois critérios de seleção de atributos voltados para Random Forests, denominados Fator de Incidência (FI) e Fator de Profundidade (FP), e é apresentada também uma análise empírica detalhada comparando o desempenho desses critérios com a Importância Baseada no Erro (IE) e a Importância de Gini (IG) - os dois principais critérios para Random Forests atualmente em uso. Os resultados indicam que o critério FP é um critério robusto, com desempenho superior aos critérios IE e IG.

Downloads

Não há dados estatísticos.

Downloads

Publicado

2014-11-15

Como Citar

Bastos, D. G., Nascimento, P. S., & Lauretto, M. de S. (2014). Análise Empírica de Desempenho de Quatro Métodos de Seleção de Características para Random Forests. Histórico Da ISys - Brazilian Journal of Information Systems (SERVIDOR ANTIGO - UNIRIO), 7(2), 25–47. Recuperado de https://seer.unirio.br/isys/article/view/3309

Baixar Citação

Edição

v. 7 n. 2 (2014)

Seção

ARTIGOS REGULARES

Licença

Autores que publicam nesta revista concordam com os seguintes termos: Autores mantém os direitos autorais e concedem à revista o direito de primeira publicação, com o trabalho simultaneamente licenciado sob a Licença Creative Commons Attribution - http://creativecommons.org/licenses/by/3.0/ que permite o compartilhamento do trabalho com reconhecimento da autoria e publicação inicial nesta revista. Autores têm autorização para assumir contratos adicionais separadamente, para distribuição não-exclusiva da versão do trabalho publicada nesta revista (ex.: publicar em repositório institucional ou como capítulo de livro), com reconhecimento de autoria e publicação inicial nesta revista. Autores têm permissão e são estimulados a publicar e distribuir seu trabalho online (ex.: em repositórios institucionais ou na sua página pessoal) a qualquer ponto antes ou durante o processo editorial, já que isso pode gerar alterações produtivas, bem como aumentar o impacto e a citação do trabalho publicado (acrescentando nesta distribuição a citação completa ao artigo na iSys).

Análise Empírica de Desempenho de Quatro Métodos de Seleção de Características para Random Forests

Autores

Resumo

Downloads

Downloads

Publicado

Como Citar

Edição

Seção

Licença

Informações