Responder a: Apagar ou preencher com o valor mais recorrente no pré-processamento?

Home Fóruns Fórum Deep Learning com Python de A a Z: O Curso Completo Apagar ou preencher com o valor mais recorrente no pré-processamento? Responder a: Apagar ou preencher com o valor mais recorrente no pré-processamento?

#39126
Denny Ceccon
Moderador

    Olá Vinícius,

    Não existe uma regra geral, pois a princípio a gente não sabe qual a relevância da variável ou do registro na modelagem do problema. Em ciência de dados, muitas vezes nos vemos obrigados a testar mais de uma abordagem e escolher a melhor a posteriori, com base nos resultados de desempenho do modelo criado.

    Mas o que você falou sobre o tamanho da base é relevante. Se o número de registros apagados for pequeno em comparação ao tamanho da base, eu geralmente escolho como primeira opção apagar o registro.