- This topic has 1 reply, 2 voices, and was last updated 4 years, 7 months ago by .
Viewing 2 posts - 1 through 2 (of 2 total)
Viewing 2 posts - 1 through 2 (of 2 total)
- You must be logged in to reply to this topic.
Home › Forums › Fórum Sumarização de Textos com Processamento de Linguagem Natural › Aula – Sumarização de vários textos
Tagged: Sumarização de vários textos
Na aula de sumarização de vários textos eu tentei colar esses links: ‘https://www.ocupacoes.com.br/cbo-mte/251205-economista” , “https://www.ocupacoes.com.br/cbo-mte/251405-filosofo” e aparece isso
for url in lista_artigos:
#print(url)
g = Goose()
artigo = g.extract(url)
lista_sentencas, melhores_sentencas, _, _ = sumarizar(artigo.cleaned_text, 5)
visualiza_resumo(artigo.title, lista_sentencas, melhores_sentencas)
ValueError Traceback (most recent call last)
<ipython-input-95-3dab20ae07e0> in <module>()
3 g = Goose()
4 artigo = g.extract(url)
—-> 5 lista_sentencas, melhores_sentencas, _, _ = sumarizar(artigo.cleaned_text, 5)
6 visualiza_resumo(artigo.title, lista_sentencas, melhores_sentencas)
<ipython-input-86-b82eb234166d> in sumarizar(texto, quantidade_sentencas)
4
5 frequencia_palavras = nltk.FreqDist(nltk.word_tokenize(texto_formatado))
—-> 6 frequencia_maxima = max(frequencia_palavras.values())
7 for palavra in frequencia_palavras.keys():
8 frequencia_palavras[palavra] = (frequencia_palavras[palavra] / frequencia_maxima)
ValueError: max() arg is an empty sequence
Não entendi o erro.
Olá Shin, esses links devem estar dentro da url para que a biblioteca realize a extração das informações da página web.
Fabio