Home › Fóruns › Fórum Machine Learning e Data Science com Python de A à Z › Projeto › Responder a: Projeto
Certo, então pode me ajudar com a função baixo, ela é para detectar e remover os outliers, mas e se eu quiser substituir os outliers pela media ou mediana, como ficaria a função?
# Função para remover os outliers
def remover_outlier(in_data,in_col):
first_quantile = in_data[in_col].quantile(0.25)
third_quantile = in_data[in_col].quantile(0.75)
iqr = third_quantile – first_quantile
upper_limit = third_quantile + 1.5 * iqr
lower_limit = first_quantile – 1.5 * iqr
in_data.loc[(in_data[in_col]>upper_limit), in_col] = upper_limit
in_data.loc[(in_data[in_col]<lower_limit), in_col] = lower_limit
return in_data
for i in variaveis_numericas:
scania = remover_outlier(scania, i)