Sumarização de Textos com PLN – utlização da biblioteca re

Home Fóruns Fórum Sumarização de Textos com Processamento de Linguagem Natural Sumarização de Textos com PLN – utlização da biblioteca re

Visualizando 2 posts - 1 até 2 (de 2 do total)
  • Autor
    Posts
  • #40266

    Boa tarde

    Sou o Reginaldo de Borba

    Estou fazendo um pré-processamento em um texto que contém vários ponto de reticência ( ………) em quantidades diferentes

    em linhas diversas. Como faço para excluir desse texto essas reticências (…….) usando a biblioteca re?

    Tentei com o texto_original = re.sub(r’\…*..+’, ‘ ‘, texto_original) mas não deu certo.

    Obrigado

    #40277
    Denny Ceccon
    Moderador

      Olá Reginaldo,

      re.sub(r'\.{3,}', '', texto_original)

      deve funcionar. Vai remover todas as vezes em que aparecer um ponto, 3 vezes seguidas ou mais.

      Pode encontrar mais informações aqui, na sessão que trata da expressão {m, n}.

    Visualizando 2 posts - 1 até 2 (de 2 do total)
    • Você deve fazer login para responder a este tópico.