- Este tópico contém 3 respostas, 3 vozes e foi atualizado pela última vez 8 meses, 2 semanas atrás por .
Visualizando 4 posts - 1 até 4 (de 4 do total)
Visualizando 4 posts - 1 até 4 (de 4 do total)
- Você deve fazer login para responder a este tópico.
Home › Fóruns › Fórum Mineração e Análise de Dados do LinkedIn › Distância de Levenshtein
Marcado: Distância de edição (Levenshtein)
Boa noite,
Para transformar a distância de Levenshtein (de edição) da NLTK de um número inteiro para um valor entre 0 e 1 (ou porcentagem) como poderia fazer?
Quando se tem textos maiores para se comparar, o ideal é usar o split() nas duas entradas de strings?
Obrigado.
Boa noite Nelson, encontrei um exemplo que pode lhe ajudar, nesse link. Sobre a segunda pergunta, sim e você pode usar o sent_tokenize().
Fabio
Obrigado!
Qualquer outra dúvida é só avisar!