- This topic has 1 reply, 2 voices, and was last updated 3 years, 10 months ago by .
 
Viewing 2 posts - 1 through 2 (of 2 total)
Viewing 2 posts - 1 through 2 (of 2 total)
- You must be logged in to reply to this topic.
 
Home › Forums › Fórum Sumarização de Textos com Processamento de Linguagem Natural › Extração de palavras de arquivo csv
Tagged: Introdução
Como faço para sumarizar e extrair verbos e substantivos de varias células de uma coluna de um arquivo csv? Eu fiz assim, mas não sei como inserir a tabela que eu quero no meu código
import nltk
 nltk.download(‘punkt’)
 nltk.download(‘averaged_perceptron_tagger’)
 text = nltk.word_tokenize(“””””)
 pos_tagged = nltk.pos_tag(text)
 pos_tagged
 NV = list(filter(lambda x: x[1] == ‘NN’ or x[1] == ‘VB’, pos_tagged))
 NV
Olá Shin, segue a resposta do instrutor Denny:
Primeiro você deve carregar a tabela usando a biblioteca Pandas:
import pandas as pd
tabela = pd.read_csv(‘tabela.csv’)
Aí você cria uma função para processar cada texto:
def processa(texto):
text = nltk.word_tokenize(texto)
 pos_tagged = nltk.pos_tag(text)
 NV = list(filter(lambda x: x[1] == ‘NN’ or x[1] == ‘VB’, pos_tagged))
return NV
Suponhamos que as frases de seu interesse estejam em uma coluna chamada Frases, você pode gerar uma lista com os resultados usando:
resultados = tabela[‘Frases’].map(processa)