Responder a: Extração de palavras de arquivo csv

#32752
Fábio Spak
Participante

    Olá Shin, segue a resposta do instrutor Denny:

     

    Primeiro você deve carregar a tabela usando a biblioteca Pandas:

     

    import pandas as pd

    tabela = pd.read_csv(‘tabela.csv’)

     

    Aí você cria uma função para processar cada texto:

     

    def processa(texto):

    text = nltk.word_tokenize(texto)
    pos_tagged = nltk.pos_tag(text)
    NV = list(filter(lambda x: x[1] == ‘NN’ or x[1] == ‘VB’, pos_tagged))

    return NV

    Suponhamos que as frases de seu interesse estejam em uma coluna chamada Frases, você pode gerar uma lista com os resultados usando:

     

    resultados = tabela[‘Frases’].map(processa)