Responder a: Projeto

#45510
Heitor Tonet
Participante

    Certo, então pode me ajudar com a função baixo, ela é para detectar e remover os outliers, mas e se eu quiser substituir os outliers pela media ou mediana, como ficaria a função?

    # Função para remover os outliers
    def remover_outlier(in_data,in_col):

    first_quantile = in_data[in_col].quantile(0.25)
    third_quantile = in_data[in_col].quantile(0.75)
    iqr = third_quantile – first_quantile
    upper_limit = third_quantile + 1.5 * iqr
    lower_limit = first_quantile – 1.5 * iqr
    in_data.loc[(in_data[in_col]>upper_limit), in_col] = upper_limit
    in_data.loc[(in_data[in_col]<lower_limit), in_col] = lower_limit
    return in_data

    for i in variaveis_numericas:
    scania = remover_outlier(scania, i)