Responder a: Dúvida no tópico do Algoritmo K-Means

#32301
Fábio Spak
Participante

    Olá Vanessals, segue a resposta do instrutor Denny:

    Como o K-Means é uma técnica de agrupamento não supervisionado, os agrupamentos são “naturais”, ou seja, eles se formam em função das características dos dados, não dos rótulos. Portanto, nem sempre há uma correlação entre os grupos formados desta forma e os rótulos conhecidos. Sendo assim, não é comum identificar os grupos formados por agrupamento com o mesmo nome original
    O que você pode fazer é verificar se os grupos formados por K-Means são parecidos com os grupos originais, usando uma função como pd.crosstab [https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.crosstab.html]. Se houver uma separação bem distinta, por exemplo se o grupo 0 tiver uma maioria da classe alto risco e o grupo 1 tiver uma maioria de baixo risco, então você pode concluir que a técnica de K-Means é adequada para classificar os registros, atribuindo a correspondência que o grupo 0 significa alto risco e o grupo 1 baixo risco, mas somente se a correspondência do exemplo existir.

    Fabio