Responder a: Extração de palavras de arquivo csv

#32752
Fábio Spak
Moderador

Olá Shin, segue a resposta do instrutor Denny:

 

Primeiro você deve carregar a tabela usando a biblioteca Pandas:

 

import pandas as pd

tabela = pd.read_csv(‘tabela.csv’)

 

Aí você cria uma função para processar cada texto:

 

def processa(texto):

text = nltk.word_tokenize(texto)
pos_tagged = nltk.pos_tag(text)
NV = list(filter(lambda x: x[1] == ‘NN’ or x[1] == ‘VB’, pos_tagged))

return NV

Suponhamos que as frases de seu interesse estejam em uma coluna chamada Frases, você pode gerar uma lista com os resultados usando:

 

resultados = tabela[‘Frases’].map(processa)