Responder a: Base com dados categóricos

Home Fóruns Fórum Ciência de Dados para Empresas e Negócios Base com dados categóricos Responder a: Base com dados categóricos

#23435
Fábio Spak
Participante

    Boa noite Nelson, você pode considerar as etapas:

    Limpeza de Dados
    Remoção de informações duplicadas/ausentes
    Remoção de observações e erros irrelevantes
    Remoção de colunas desnecessárias
    Tratamento de dados inconsistentes
    Tratamento de outliers e ruído

    O método comum é normalizar a unidade de cada dimensão individualmente.

    Aplique métodos de redução de dimensionalidade.

    No artigo abaixo (fonte da resposta) você encontrar esse assunto um pouco mais sobre esse assunto:

    https://www.edupristine.com/blog/k-means-algorithm

    Assim como, nessa discussão você obter mais alguns insights:

    https://datascience.stackexchange.com/questions/22/k-means-clustering-for-mixed-numeric-and-categorical-data

    Fabio