Home › Fóruns › Fórum Sumarização de Textos com Processamento de Linguagem Natural › Extração de palavras de arquivo csv › Responder a: Extração de palavras de arquivo csv
17 de dezembro de 2021 às 10:11 #32752
Olá Shin, segue a resposta do instrutor Denny:
Primeiro você deve carregar a tabela usando a biblioteca Pandas:
import pandas as pd
tabela = pd.read_csv(‘tabela.csv’)
Aí você cria uma função para processar cada texto:
def processa(texto):
text = nltk.word_tokenize(texto)
pos_tagged = nltk.pos_tag(text)
NV = list(filter(lambda x: x[1] == ‘NN’ or x[1] == ‘VB’, pos_tagged))
return NV
Suponhamos que as frases de seu interesse estejam em uma coluna chamada Frases, você pode gerar uma lista com os resultados usando:
resultados = tabela[‘Frases’].map(processa)