Responder a: Mineração de dados

#21818
Fábio Spak
Instrutor

Boa noite Carlos, o pontos importantes podem variar de acordo com o objetivo do seu projeto, veja alguns na lista baixo:

  • Valores ausentes, do tipo NaN, os quais você pode preencher manualmente se o o conjunto de dados for pequeno.
  • Ainda no caso dos valores ausentes, você pode utilizar a média para preencher a lacuna. Ou criar uma nova categoria “desconhecidos”.
  • Dados ruidosos.
  • Dados inválidos .
  • Valores duplicados/redundantes ou irrelevantes.
  • Erros estruturais, como por exemplo: digitação incorreta, mesmo atributo com nomes diferentes, classes mal rotuladas.

Fabio