Sumarização de Textos com PLN - utlização da biblioteca re | IA Expert Academy

Tagged: Pré-processamento do texto 1 (Algoritmo baseado em frequência)

This topic has 1 reply, 2 voices, and was last updated 3 years, 2 months ago by Denny Ceccon.

Viewing 2 posts - 1 through 2 (of 2 total)

Author

Posts
18 de abril de 2023 at 17:27 #40266
Reginaldo de Borba Vasconcelos Filho
Participant
Boa tarde

Sou o Reginaldo de Borba

Estou fazendo um pré-processamento em um texto que contém vários ponto de reticência ( ………) em quantidades diferentes

em linhas diversas. Como faço para excluir desse texto essas reticências (…….) usando a biblioteca re?

Tentei com o texto_original = re.sub(r’\…*..+’, ‘ ‘, texto_original) mas não deu certo.

Obrigado
20 de abril de 2023 at 15:34 #40277
Denny Ceccon
Moderator
Olá Reginaldo,
```
re.sub(r'\.{3,}', '', texto_original)
```
deve funcionar. Vai remover todas as vezes em que aparecer um ponto, 3 vezes seguidas ou mais.

Pode encontrar mais informações aqui, na sessão que trata da expressão {m, n}.
Author

Posts

Viewing 2 posts - 1 through 2 (of 2 total)

You must be logged in to reply to this topic.