Aula - Sumarização de vários textos | IA Expert Academy

Tagged: Sumarização de vários textos

This topic has 1 reply, 2 voices, and was last updated 4 years, 8 months ago by Fábio Spak.

Viewing 2 posts - 1 through 2 (of 2 total)

Author

Posts
9 de novembro de 2021 at 11:33 #32249
Shin
Participant
Na aula de sumarização de vários textos eu tentei colar esses links: ‘https://www.ocupacoes.com.br/cbo-mte/251205-economista” , “https://www.ocupacoes.com.br/cbo-mte/251405-filosofo” e aparece isso

for url in lista_artigos:
#print(url)
g = Goose()
artigo = g.extract(url)
lista_sentencas, melhores_sentencas, _, _ = sumarizar(artigo.cleaned_text, 5)
visualiza_resumo(artigo.title, lista_sentencas, melhores_sentencas)

ValueError Traceback (most recent call last)

<ipython-input-95-3dab20ae07e0> in <module>()
3 g = Goose()
4 artigo = g.extract(url)
—-> 5 lista_sentencas, melhores_sentencas, _, _ = sumarizar(artigo.cleaned_text, 5)
6 visualiza_resumo(artigo.title, lista_sentencas, melhores_sentencas)

<ipython-input-86-b82eb234166d> in sumarizar(texto, quantidade_sentencas)
4
5 frequencia_palavras = nltk.FreqDist(nltk.word_tokenize(texto_formatado))
—-> 6 frequencia_maxima = max(frequencia_palavras.values())
7 for palavra in frequencia_palavras.keys():
8 frequencia_palavras[palavra] = (frequencia_palavras[palavra] / frequencia_maxima)

ValueError: max() arg is an empty sequence

Não entendi o erro.
10 de novembro de 2021 at 21:02 #32258
Fábio Spak
Participant
Olá Shin, esses links devem estar dentro da url para que a biblioteca realize a extração das informações da página web.

Fabio
Author

Posts

Viewing 2 posts - 1 through 2 (of 2 total)

You must be logged in to reply to this topic.