- Este tópico contém 1 resposta, 2 vozes e foi atualizado pela última vez 1 ano atrás por .
Visualizando 2 posts - 1 até 2 (de 2 do total)
Visualizando 2 posts - 1 até 2 (de 2 do total)
- Você deve fazer login para responder a este tópico.
Home › Fóruns › Fórum Machine Learning e Data Science com Python de A à Z › Regressao Linear
Ola, estou estudando agora Regressao Linear, e os date base sao da house_price.csv.
No exemplo so estou pegando o tamanho da casa valor da casa(class), e o score e muito baixo, na verdade nao vejo muita vantagem, (claro isto e questao de aprendizagem agora) e que o valor da casa, nao depende apenas do tamanho, mas sim do local da casa, pois depende do local as casas sao mais caro ou mais baratas.
O codigo e esse:
import pandas as pd
base = pd.read_csv(‘house_prices.csv’)
X = base.iloc[:, 5:6].values
y = base.iloc[:, 2].values
**A minha pergunta e: como poderia acrescar os valores do Zip Code(a localizacao das casas) no X?
Por que o LabelEncoder, OneHotEncoder, sao para valores categoricos e nao tem nesta data base valores categoricos.
Obrigado pela informacao e ajuda.
É só incluir na seleção dos valores o número da coluna que corresponde ao zip code. Mas como você bem disse, este valor é categórico, então precisa ser tratado com OneHotEncoder antes de passar ao algoritmo.