- Este tópico contém 1 resposta, 2 vozes e foi atualizado pela última vez 3 anos, 4 meses atrás por .
Visualizando 2 posts - 1 até 2 (de 2 do total)
Visualizando 2 posts - 1 até 2 (de 2 do total)
- Você deve fazer login para responder a este tópico.
Home › Fóruns › Fórum Sumarização de Textos com Processamento de Linguagem Natural › Extração de palavras de arquivo csv
Marcado: Introdução
Como faço para sumarizar e extrair verbos e substantivos de varias células de uma coluna de um arquivo csv? Eu fiz assim, mas não sei como inserir a tabela que eu quero no meu código
import nltk
nltk.download(‘punkt’)
nltk.download(‘averaged_perceptron_tagger’)
text = nltk.word_tokenize(“””””)
pos_tagged = nltk.pos_tag(text)
pos_tagged
NV = list(filter(lambda x: x[1] == ‘NN’ or x[1] == ‘VB’, pos_tagged))
NV
Olá Shin, segue a resposta do instrutor Denny:
Primeiro você deve carregar a tabela usando a biblioteca Pandas:
import pandas as pd
tabela = pd.read_csv(‘tabela.csv’)
Aí você cria uma função para processar cada texto:
def processa(texto):
text = nltk.word_tokenize(texto)
pos_tagged = nltk.pos_tag(text)
NV = list(filter(lambda x: x[1] == ‘NN’ or x[1] == ‘VB’, pos_tagged))
return NV
Suponhamos que as frases de seu interesse estejam em uma coluna chamada Frases, você pode gerar uma lista com os resultados usando:
resultados = tabela[‘Frases’].map(processa)