Ajuda para atualizar a linha do append para concat

Home Fóruns Fórum Machine Learning para Competições Kaggle Curso 1 Ajuda para atualizar a linha do append para concat

Visualizando 4 posts - 1 até 4 (de 4 do total)
  • Autor
    Posts
  • #43914

    Boa noite

    Estou bem no começo do curso, e já estou utilizando o pandas 2, procurei conteúdo na internet e até mesmo no chat GPT mas não consegui prosseguir com a aula.

     

    O método append do DataFrame foi descontinuado e agora no lugar temos concat. No entanto não consegui fazer uma adaptação para a nova versão do pandas.

     

    O mais próximo que consegui foi o Código abaixo, porém desta forma ele esta invertendo e eu acabo com 351788 linhas e 190 colunas.

    counts_per_column = pd.DataFrame()

    for col in numerical_variables:
    col_count = features.groupby(col).size()

    counts_per_column = pd.concat([counts_per_column, col_count], axis=1, ignore_index=True)

    counts_per_column.shape

    Obs: o código está devidamente indentado no notebook, só não consegui replicar aqui

    #43916
    Denny Ceccon
    Moderador

      Olá Guilherme,

      Como atualizar o código em função de novas versões das bibliotecas pode ser bem trabalhoso, nosso compromisso é garantir que o código funciona na versão apresentada na aula. Eu acredito que o Pandas versão 1.5.3 (atualmente disponível no Colab) está funcionado corretamente.

      #44490
      Abel Philippe
      Participante

        Opa, salve. Seguinte, Guilherme, se tu quiser inverter as linhas e as colunas, tu precisarás usar o “.T”.

        Vai ficar desse jeito aqui:

        • [ ] Primeira célula

        counts_per_column = pd.DataFrame()

        for col in numerical_variables:
        col_count = features.groupby(col).size()

        counts_per_column = pd.concat([counts_per_column, col_count], axis=1, ignore_index=True)

         

        • [ ] Segunda célula

        count_per_column = count_per_column.T

        counts_per_column.shape
        <h6>#######################</h6>
        Se tu fizer isso, após tu usar o shape, a ordem ficará invertida e o código posterior irá funcionar tranquilamente.

        Obs: se você usar o “count_per_column = count_per_column.T” abaixo de concat, na primeira célula, o programa irá quebrar por causa da RAM.

        Use em células separadas, fora da repetição.

        • Esta resposta foi modificada 12 horas, 50 minutos atrás por Abel Philippe.
        #44492
        Abel Philippe
        Participante

          Demonstração

          Tá aí um exemplo

        Visualizando 4 posts - 1 até 4 (de 4 do total)
        • Você deve fazer login para responder a este tópico.