Diferentes resultado

Visualizando 2 posts - 1 até 2 (de 2 do total)
  • Autor
    Posts
  • #18522
    Emerson
    Participante

    foto result

    Ola fiz esse codigo abaixo, mas o resultado esta completamente diferente do video do curso.
    Nao entendo por que no meu resultado, esta dando negativo.
    O codigo que tenho e:

    import pandas as pd
    import numpy as np
    base = pd.read_csv(‘credit_data.csv’)
    base.describe()
    base.loc[base[‘age’] < 0]
    # apagar a coluna

    base.drop(‘age’, 1, inplace=True)
    # apagar somente os registros com problema
    base.drop(base[base.age < 0].index, inplace=True)
    # preencher os valores manualmente
    # preencher os valores com a média
    base.mean()
    base[‘age’].mean()
    base[‘age’][base.age > 0].mean()
    base.loc[base.age < 0, ‘age’] = 40.92

    pd.isnull(base[‘age’])
    base.loc[pd.isnull(base[‘age’])]

    #completr valores
    previsores = base.iloc[:, 1:4].values
    classe = base.iloc[:, 4].values

    from sklearn.impute import SimpleImputer
    imputer = SimpleImputer(missing_values=np.nan, strategy=’mean’)
    imputer = imputer.fit(previsores[:, 0:3])
    previsores[:, 0:3] = imputer.transform(previsores[:,0:3])

    from sklearn.preprocessing import StandardScaler
    scaler = StandardScaler()
    previsores = scaler.fit_transform(previsores)

     

    Obrigado pela ajuda…

    #18578
    Fábio Spak
    Participante

    Boa noite Emerson, esta correto, esse é o comportamento do StandardScaler. Ou seja, dada uma entrada x, transforme-a em (x-media)/std. Portanto, mesmo que seus valores de entrada sejam todos positivos, a remoção da média pode tornar alguns deles negativos.

    Bons estudos 🙂

     

Visualizando 2 posts - 1 até 2 (de 2 do total)
  • Você deve fazer login para responder a este tópico.