Home › Fóruns › Fórum Machine Learning para Competições Kaggle Curso 1 › Ajuda para atualizar a linha do append para concat
- Este tópico contém 4 respostas, 4 vozes e foi atualizado pela última vez 5 meses, 1 semana atrás por Jones Granatyr.
- AutorPosts
- 19 de fevereiro de 2024 às 23:14 #43914
Boa noite
Estou bem no começo do curso, e já estou utilizando o pandas 2, procurei conteúdo na internet e até mesmo no chat GPT mas não consegui prosseguir com a aula.
O método append do DataFrame foi descontinuado e agora no lugar temos concat. No entanto não consegui fazer uma adaptação para a nova versão do pandas.
O mais próximo que consegui foi o Código abaixo, porém desta forma ele esta invertendo e eu acabo com 351788 linhas e 190 colunas.
counts_per_column = pd.DataFrame()
for col in numerical_variables:
col_count = features.groupby(col).size()counts_per_column = pd.concat([counts_per_column, col_count], axis=1, ignore_index=True)
counts_per_column.shape
Obs: o código está devidamente indentado no notebook, só não consegui replicar aqui
21 de fevereiro de 2024 às 09:58 #43916Olá Guilherme,
Como atualizar o código em função de novas versões das bibliotecas pode ser bem trabalhoso, nosso compromisso é garantir que o código funciona na versão apresentada na aula. Eu acredito que o Pandas versão 1.5.3 (atualmente disponível no Colab) está funcionado corretamente.
18 de abril de 2024 às 02:27 #44490Opa, salve. Seguinte, Guilherme, se tu quiser inverter as linhas e as colunas, tu precisarás usar o “.T”.
Vai ficar desse jeito aqui:
- [ ] Primeira célula
counts_per_column = pd.DataFrame()
for col in numerical_variables:
col_count = features.groupby(col).size()counts_per_column = pd.concat([counts_per_column, col_count], axis=1, ignore_index=True)
- [ ] Segunda célula
count_per_column = count_per_column.T
counts_per_column.shape
<h6>#######################</h6>
Se tu fizer isso, após tu usar o shape, a ordem ficará invertida e o código posterior irá funcionar tranquilamente.Obs: se você usar o “count_per_column = count_per_column.T” abaixo de concat, na primeira célula, o programa irá quebrar por causa da RAM.
Use em células separadas, fora da repetição.
- Esta resposta foi modificada 5 meses, 2 semanas atrás por Abel Philippe.
18 de abril de 2024 às 03:05 #44492Tá aí um exemplo
29 de abril de 2024 às 09:28 #44579Obrigado pela contribuição!
- AutorPosts
- Você deve fazer login para responder a este tópico.