- This topic has 5 replies, 3 voices, and was last updated 2 years, 1 month ago by .
Viewing 6 posts - 1 through 6 (of 6 total)
Viewing 6 posts - 1 through 6 (of 6 total)
- You must be logged in to reply to this topic.
Home › Forums › Fórum Estatística para Ciência de Dados e Machine Learning › Qui quadrado
Professor,o feature selection(qui quadrado),funciona com variáveis qualitativas,ou tem que fazer algum procedimento antes?
Olá Caio,
As classes qualitativas devem estar representadas com 0 (para ausência) e 1 (para presença), como acontece com várias colunas do dataset mostrado na aula.
por exemplo,casado,solteiro e viuvo = 1,nulo =0.O que importa é a presença do registro em si,não a informação?
Depende, neste caso o 1 vai só significar se o registro não está nulo para a categoria “estado civil”. Se você quiser explicitar que a categoria pode ser casado, solteiro, viúvo ou nulo, precisa fazer desta forma:
reg1: casado => [1, 0, 0, 0] reg2: solteiro => [0, 1, 0, 0] reg3: viúvo => [0, 0, 1, 0] reg4: nulo => [0, 0, 0, 1]
Assim, cada posição da lista indica uma das 4 categorias possíveis para “estado civil”.
Esta codificação é tão comum que é chamada de One Hot Encoding, você vai encontrar referências a ela e como realizá-la no curso Machine Learning e Data Science com Python de A à Z, Parte 1 – Classificação, aula Atributos categóricos – OneHotEncoder.
opa,entendi.Valeu.
Qualquer outra dúvida é só avisar!