Responder a: Mineração de dados

#21818
Fábio Spak
Participante

    Boa noite Carlos, o pontos importantes podem variar de acordo com o objetivo do seu projeto, veja alguns na lista baixo:

    • Valores ausentes, do tipo NaN, os quais você pode preencher manualmente se o o conjunto de dados for pequeno.
    • Ainda no caso dos valores ausentes, você pode utilizar a média para preencher a lacuna. Ou criar uma nova categoria “desconhecidos”.
    • Dados ruidosos.
    • Dados inválidos .
    • Valores duplicados/redundantes ou irrelevantes.
    • Erros estruturais, como por exemplo: digitação incorreta, mesmo atributo com nomes diferentes, classes mal rotuladas.

    Fabio