Responder a: Base com dados categóricos

Home Fóruns Fórum Ciência de Dados para Empresas e Negócios Base com dados categóricos Responder a: Base com dados categóricos

#23443
Nelson
Participante

    Obrigado pelo retorno.
    No caso de base de dados com variáveis, por exemplo, faixa de idade, gênero, Estado e categoria S/N, normalmente é mais adequado, antes de rodar no k-means, utilizar o pd.get_dummies, o labelencoder ou mesmo o one hot encoding? Em cada variável poderia utilizar uma forma diferente? É necessário também transformar em array após o procedimento anterior?
    Obrigado.