- This topic has 4 replies, 2 voices, and was last updated 3 years, 10 months ago by .
Viewing 5 posts - 1 through 5 (of 5 total)
Viewing 5 posts - 1 through 5 (of 5 total)
- You must be logged in to reply to this topic.
Home › Forums › Fórum Mineração de Emoção em Textos com Python e NLTK › extratorpalavras
def extratorpalavras(documento):
doc = set(documento)
caracteristicas = {}
for palavra in palavrasunicastreinamento:
caracteristicas['%s' % palavra] = (palavra in doc)
return caracteristicas
Professor,nessa parte do código a gente pega uma frase,verifica essa frase nas 'palavrasunicastreinamento'
,nas palavras presente dessa frase coloca um true,e false em todas as outras não presentes,só que
a gente essa mesma função tanto pra base teste,como para a base treinamento,só que se caso exista uma palavra que só
aparece na base de teste,como estamos usando 'palavrasunicastreinamento',a palavra não vai se perder?
professor,poderia me ajudar a entender essa parte da função
caracteristicas[‘%s’ % palavra] = (palavra in doc)
Oi Caio,
%s é um “placeholder”, quer dizer que ali vai entrar uma string, e com % palavra nós dizemos que a string está contido em palavra.
Ou seja, se palavrasunicastreinamento for uma lista com ['banana', 'maca', 'laranja'], então no final do loop você vai ter o dicionário caracteristicas contendo essas 3 chaves.
então ele vai pegar palavra por palavra,verificar o documneto(nesse caso são frases),vai verificar qual palavra está presente no doc(frase),se estiver presente =True,se não= False?
Isso.