Diferentes resultado

Visualizando 2 posts - 1 até 2 (de 2 do total)
  • Autor
    Posts
  • #18522
    Emerson
    Participante

      foto result

      Ola fiz esse codigo abaixo, mas o resultado esta completamente diferente do video do curso.
      Nao entendo por que no meu resultado, esta dando negativo.
      O codigo que tenho e:

      import pandas as pd
      import numpy as np
      base = pd.read_csv(‘credit_data.csv’)
      base.describe()
      base.loc[base[‘age’] < 0]
      # apagar a coluna

      base.drop(‘age’, 1, inplace=True)
      # apagar somente os registros com problema
      base.drop(base[base.age < 0].index, inplace=True)
      # preencher os valores manualmente
      # preencher os valores com a média
      base.mean()
      base[‘age’].mean()
      base[‘age’][base.age > 0].mean()
      base.loc[base.age < 0, ‘age’] = 40.92

      pd.isnull(base[‘age’])
      base.loc[pd.isnull(base[‘age’])]

      #completr valores
      previsores = base.iloc[:, 1:4].values
      classe = base.iloc[:, 4].values

      from sklearn.impute import SimpleImputer
      imputer = SimpleImputer(missing_values=np.nan, strategy=’mean’)
      imputer = imputer.fit(previsores[:, 0:3])
      previsores[:, 0:3] = imputer.transform(previsores[:,0:3])

      from sklearn.preprocessing import StandardScaler
      scaler = StandardScaler()
      previsores = scaler.fit_transform(previsores)

       

      Obrigado pela ajuda…

      #18578
      Fábio Spak
      Participante

        Boa noite Emerson, esta correto, esse é o comportamento do StandardScaler. Ou seja, dada uma entrada x, transforme-a em (x-media)/std. Portanto, mesmo que seus valores de entrada sejam todos positivos, a remoção da média pode tornar alguns deles negativos.

        Bons estudos 🙂

         

      Visualizando 2 posts - 1 até 2 (de 2 do total)
      • Você deve fazer login para responder a este tópico.