Home › Fóruns › Fórum Sumarização de Textos com Processamento de Linguagem Natural › Aula – Sumarização de vários textos
Marcado: Sumarização de vários textos
- Este tópico contém 1 resposta, 2 vozes e foi atualizado pela última vez 3 anos, 3 meses atrás por
Fábio Spak.
- AutorPosts
- 9 de novembro de 2021 às 11:33 #32249
Na aula de sumarização de vários textos eu tentei colar esses links: ‘https://www.ocupacoes.com.br/cbo-mte/251205-economista” , “https://www.ocupacoes.com.br/cbo-mte/251405-filosofo” e aparece isso
for url in lista_artigos:
#print(url)
g = Goose()
artigo = g.extract(url)
lista_sentencas, melhores_sentencas, _, _ = sumarizar(artigo.cleaned_text, 5)
visualiza_resumo(artigo.title, lista_sentencas, melhores_sentencas)ValueError Traceback (most recent call last)
<ipython-input-95-3dab20ae07e0> in <module>()
3 g = Goose()
4 artigo = g.extract(url)
—-> 5 lista_sentencas, melhores_sentencas, _, _ = sumarizar(artigo.cleaned_text, 5)
6 visualiza_resumo(artigo.title, lista_sentencas, melhores_sentencas)<ipython-input-86-b82eb234166d> in sumarizar(texto, quantidade_sentencas)
4
5 frequencia_palavras = nltk.FreqDist(nltk.word_tokenize(texto_formatado))
—-> 6 frequencia_maxima = max(frequencia_palavras.values())
7 for palavra in frequencia_palavras.keys():
8 frequencia_palavras[palavra] = (frequencia_palavras[palavra] / frequencia_maxima)ValueError: max() arg is an empty sequence
Não entendi o erro.
10 de novembro de 2021 às 21:02 #32258Olá Shin, esses links devem estar dentro da url para que a biblioteca realize a extração das informações da página web.
Fabio
- AutorPosts
- Você deve fazer login para responder a este tópico.