- This topic has 1 reply, 2 voices, and was last updated 3 years, 10 months ago by .
Viewing 2 posts - 1 through 2 (of 2 total)
Viewing 2 posts - 1 through 2 (of 2 total)
- You must be logged in to reply to this topic.
Home › Forums › Fórum Sumarização de Textos com Processamento de Linguagem Natural › Extração de palavras de arquivo csv
Tagged: Introdução
Como faço para sumarizar e extrair verbos e substantivos de varias células de uma coluna de um arquivo csv? Eu fiz assim, mas não sei como inserir a tabela que eu quero no meu código
import nltk
nltk.download(‘punkt’)
nltk.download(‘averaged_perceptron_tagger’)
text = nltk.word_tokenize(“””””)
pos_tagged = nltk.pos_tag(text)
pos_tagged
NV = list(filter(lambda x: x[1] == ‘NN’ or x[1] == ‘VB’, pos_tagged))
NV
Olá Shin, segue a resposta do instrutor Denny:
Primeiro você deve carregar a tabela usando a biblioteca Pandas:
import pandas as pd
tabela = pd.read_csv(‘tabela.csv’)
Aí você cria uma função para processar cada texto:
def processa(texto):
text = nltk.word_tokenize(texto)
pos_tagged = nltk.pos_tag(text)
NV = list(filter(lambda x: x[1] == ‘NN’ or x[1] == ‘VB’, pos_tagged))
return NV
Suponhamos que as frases de seu interesse estejam em uma coluna chamada Frases, você pode gerar uma lista com os resultados usando:
resultados = tabela[‘Frases’].map(processa)