- Este tópico contém 1 resposta, 2 vozes e foi atualizado pela última vez 2 anos atrás por .
Visualizando 2 posts - 1 até 2 (de 2 do total)
Visualizando 2 posts - 1 até 2 (de 2 do total)
- Você deve fazer login para responder a este tópico.
Home › Fóruns › Fórum Sumarização de Textos com Processamento de Linguagem Natural › Sumarização de Textos com PLN – utlização da biblioteca re
Boa tarde
Sou o Reginaldo de Borba
Estou fazendo um pré-processamento em um texto que contém vários ponto de reticência ( ………) em quantidades diferentes
em linhas diversas. Como faço para excluir desse texto essas reticências (…….) usando a biblioteca re?
Tentei com o texto_original = re.sub(r’\…*..+’, ‘ ‘, texto_original) mas não deu certo.
Obrigado
Olá Reginaldo,
re.sub(r'\.{3,}', '', texto_original)
deve funcionar. Vai remover todas as vezes em que aparecer um ponto, 3 vezes seguidas ou mais.
Pode encontrar mais informações aqui, na sessão que trata da expressão {m, n}
.