Aula – Sumarização de vários textos

Home Fóruns Fórum Sumarização de Textos com Processamento de Linguagem Natural Aula – Sumarização de vários textos

Visualizando 2 posts - 1 até 2 (de 2 do total)
  • Autor
    Posts
  • #32249
    Shin
    Participante

      Na aula de sumarização de vários textos eu tentei colar esses links: ‘https://www.ocupacoes.com.br/cbo-mte/251205-economista” , “https://www.ocupacoes.com.br/cbo-mte/251405-filosofo” e aparece isso

      for url in lista_artigos:
      #print(url)
      g = Goose()
      artigo = g.extract(url)
      lista_sentencas, melhores_sentencas, _, _ = sumarizar(artigo.cleaned_text, 5)
      visualiza_resumo(artigo.title, lista_sentencas, melhores_sentencas)

       

      ValueError Traceback (most recent call last)

      <ipython-input-95-3dab20ae07e0> in <module>()
      3 g = Goose()
      4 artigo = g.extract(url)
      —-> 5 lista_sentencas, melhores_sentencas, _, _ = sumarizar(artigo.cleaned_text, 5)
      6 visualiza_resumo(artigo.title, lista_sentencas, melhores_sentencas)

      <ipython-input-86-b82eb234166d> in sumarizar(texto, quantidade_sentencas)
      4
      5 frequencia_palavras = nltk.FreqDist(nltk.word_tokenize(texto_formatado))
      —-> 6 frequencia_maxima = max(frequencia_palavras.values())
      7 for palavra in frequencia_palavras.keys():
      8 frequencia_palavras[palavra] = (frequencia_palavras[palavra] / frequencia_maxima)

      ValueError: max() arg is an empty sequence

      Não entendi o erro.

      #32258
      Fábio Spak
      Participante

        Olá Shin, esses links devem estar dentro da url para que a biblioteca realize a extração das informações da página web.

        Fabio

      Visualizando 2 posts - 1 até 2 (de 2 do total)
      • Você deve fazer login para responder a este tópico.