Aula – Sumarização de vários textos

Home Fóruns Fórum Sumarização de Textos com Processamento de Linguagem Natural Aula – Sumarização de vários textos

Visualizando 2 posts - 1 até 2 (de 2 do total)
  • Autor
    Posts
  • #32249
    Shin
    Participante

    Na aula de sumarização de vários textos eu tentei colar esses links: ‘https://www.ocupacoes.com.br/cbo-mte/251205-economista” , “https://www.ocupacoes.com.br/cbo-mte/251405-filosofo” e aparece isso

    for url in lista_artigos:
    #print(url)
    g = Goose()
    artigo = g.extract(url)
    lista_sentencas, melhores_sentencas, _, _ = sumarizar(artigo.cleaned_text, 5)
    visualiza_resumo(artigo.title, lista_sentencas, melhores_sentencas)

     

    ValueError Traceback (most recent call last)

    <ipython-input-95-3dab20ae07e0> in <module>()
    3 g = Goose()
    4 artigo = g.extract(url)
    —-> 5 lista_sentencas, melhores_sentencas, _, _ = sumarizar(artigo.cleaned_text, 5)
    6 visualiza_resumo(artigo.title, lista_sentencas, melhores_sentencas)

    <ipython-input-86-b82eb234166d> in sumarizar(texto, quantidade_sentencas)
    4
    5 frequencia_palavras = nltk.FreqDist(nltk.word_tokenize(texto_formatado))
    —-> 6 frequencia_maxima = max(frequencia_palavras.values())
    7 for palavra in frequencia_palavras.keys():
    8 frequencia_palavras[palavra] = (frequencia_palavras[palavra] / frequencia_maxima)

    ValueError: max() arg is an empty sequence

    Não entendi o erro.

    #32258
    Fábio Spak
    Participante

    Olá Shin, esses links devem estar dentro da url para que a biblioteca realize a extração das informações da página web.

    Fabio

Visualizando 2 posts - 1 até 2 (de 2 do total)
  • Você deve fazer login para responder a este tópico.