Extração de palavras de arquivo csv

Marcado: 

Visualizando 2 posts - 1 até 2 (de 2 do total)
  • Autor
    Posts
  • #32740
    Shin
    Participante

    Como faço para sumarizar e extrair verbos e substantivos de varias células de uma coluna de um arquivo csv? Eu fiz assim, mas não sei como inserir a tabela que eu quero no meu código

    import nltk
    nltk.download(‘punkt’)
    nltk.download(‘averaged_perceptron_tagger’)
    text = nltk.word_tokenize(“””””)
    pos_tagged = nltk.pos_tag(text)
    pos_tagged
    NV = list(filter(lambda x: x[1] == ‘NN’ or x[1] == ‘VB’, pos_tagged))
    NV

    #32752

    Olá Shin, segue a resposta do instrutor Denny:

     

    Primeiro você deve carregar a tabela usando a biblioteca Pandas:

     

    import pandas as pd

    tabela = pd.read_csv(‘tabela.csv’)

     

    Aí você cria uma função para processar cada texto:

     

    def processa(texto):

    text = nltk.word_tokenize(texto)
    pos_tagged = nltk.pos_tag(text)
    NV = list(filter(lambda x: x[1] == ‘NN’ or x[1] == ‘VB’, pos_tagged))

    return NV

    Suponhamos que as frases de seu interesse estejam em uma coluna chamada Frases, você pode gerar uma lista com os resultados usando:

     

    resultados = tabela[‘Frases’].map(processa)

Visualizando 2 posts - 1 até 2 (de 2 do total)
  • Você deve fazer login para responder a este tópico.