Responder a: Base com dados categóricos

Home Fóruns Fórum Ciência de Dados para Empresas e Negócios Base com dados categóricos Responder a: Base com dados categóricos

#23435

Boa noite Nelson, você pode considerar as etapas:

Limpeza de Dados
Remoção de informações duplicadas/ausentes
Remoção de observações e erros irrelevantes
Remoção de colunas desnecessárias
Tratamento de dados inconsistentes
Tratamento de outliers e ruído

O método comum é normalizar a unidade de cada dimensão individualmente.

Aplique métodos de redução de dimensionalidade.

No artigo abaixo (fonte da resposta) você encontrar esse assunto um pouco mais sobre esse assunto:

https://www.edupristine.com/blog/k-means-algorithm

Assim como, nessa discussão você obter mais alguns insights:

https://datascience.stackexchange.com/questions/22/k-means-clustering-for-mixed-numeric-and-categorical-data

Fabio