Extração de palavras de arquivo csv

Marcado: 

Visualizando 2 posts - 1 até 2 (de 2 do total)
  • Autor
    Posts
  • #32740
    Shin
    Participante

      Como faço para sumarizar e extrair verbos e substantivos de varias células de uma coluna de um arquivo csv? Eu fiz assim, mas não sei como inserir a tabela que eu quero no meu código

      import nltk
      nltk.download(‘punkt’)
      nltk.download(‘averaged_perceptron_tagger’)
      text = nltk.word_tokenize(“””””)
      pos_tagged = nltk.pos_tag(text)
      pos_tagged
      NV = list(filter(lambda x: x[1] == ‘NN’ or x[1] == ‘VB’, pos_tagged))
      NV

      #32752
      Fábio Spak
      Participante

        Olá Shin, segue a resposta do instrutor Denny:

         

        Primeiro você deve carregar a tabela usando a biblioteca Pandas:

         

        import pandas as pd

        tabela = pd.read_csv(‘tabela.csv’)

         

        Aí você cria uma função para processar cada texto:

         

        def processa(texto):

        text = nltk.word_tokenize(texto)
        pos_tagged = nltk.pos_tag(text)
        NV = list(filter(lambda x: x[1] == ‘NN’ or x[1] == ‘VB’, pos_tagged))

        return NV

        Suponhamos que as frases de seu interesse estejam em uma coluna chamada Frases, você pode gerar uma lista com os resultados usando:

         

        resultados = tabela[‘Frases’].map(processa)

      Visualizando 2 posts - 1 até 2 (de 2 do total)
      • Você deve fazer login para responder a este tópico.