Home › Fóruns › Fórum Machine Learning e Data Science com Python de A à Z › Mineração de dados › Responder a: Mineração de dados
28 de outubro de 2020 às 00:36 #21818
Mestre
Boa noite Carlos, o pontos importantes podem variar de acordo com o objetivo do seu projeto, veja alguns na lista baixo:
- Valores ausentes, do tipo NaN, os quais você pode preencher manualmente se o o conjunto de dados for pequeno.
- Ainda no caso dos valores ausentes, você pode utilizar a média para preencher a lacuna. Ou criar uma nova categoria “desconhecidos”.
- Dados ruidosos.
- Dados inválidos .
- Valores duplicados/redundantes ou irrelevantes.
- Erros estruturais, como por exemplo: digitação incorreta, mesmo atributo com nomes diferentes, classes mal rotuladas.
Fabio