- Este tópico contém 2 respostas, 2 vozes e foi atualizado pela última vez 1 ano, 8 meses atrás por .
Visualizando 3 posts - 1 até 3 (de 3 do total)
Visualizando 3 posts - 1 até 3 (de 3 do total)
- Você deve fazer login para responder a este tópico.
Home › Fóruns › Fórum Mineração e Análise de Dados do LinkedIn › Distância de Levenshtein
Marcado: Distância de edição (Levenshtein)
Boa noite,
Para transformar a distância de Levenshtein (de edição) da NLTK de um número inteiro para um valor entre 0 e 1 (ou porcentagem) como poderia fazer?
Quando se tem textos maiores para se comparar, o ideal é usar o split() nas duas entradas de strings?
Obrigado.
Boa noite Nelson, encontrei um exemplo que pode lhe ajudar, nesse link. Sobre a segunda pergunta, sim e você pode usar o sent_tokenize().
Fabio
Obrigado!