Home Forums Fórum Sumarização de Textos com Processamento de Linguagem Natural Sumarização de Textos com PLN – utlização da biblioteca re

Viewing 2 posts - 1 through 2 (of 2 total)
  • Author
    Posts
  • #40266

    Boa tarde

    Sou o Reginaldo de Borba

    Estou fazendo um pré-processamento em um texto que contém vários ponto de reticência ( ………) em quantidades diferentes

    em linhas diversas. Como faço para excluir desse texto essas reticências (…….) usando a biblioteca re?

    Tentei com o texto_original = re.sub(r’\…*..+’, ‘ ‘, texto_original) mas não deu certo.

    Obrigado

    #40277
    Denny Ceccon
    Moderator

      Olá Reginaldo,

      re.sub(r'\.{3,}', '', texto_original)

      deve funcionar. Vai remover todas as vezes em que aparecer um ponto, 3 vezes seguidas ou mais.

      Pode encontrar mais informações aqui, na sessão que trata da expressão {m, n}.

    Viewing 2 posts - 1 through 2 (of 2 total)
    • You must be logged in to reply to this topic.