Naive Bayes em texto II | IA Expert Academy

Tagged: Naive Bayes em texto II

This topic has 5 replies, 4 voices, and was last updated 4 years, 11 months ago by Fábio Spak.

Viewing 6 posts - 1 through 6 (of 6 total)

Author
Posts
22 de setembro de 2020 at 07:49 #20814
Flavia
Participant
No vídeo Naive Bayes em texto II.
O algoritmo classificou a frase como alegria em 69% e 31% em medo. A frase ao ler seria de medo, neste caso seria um erro do algoritmo? Teria que ter mais treinamento para então ter uma resposta coerente e eficácia?

att,
- This topic was modified 5 years, 7 months ago by Flavia.
22 de setembro de 2020 at 17:07 #20820
Jones Granatyr
Keymaster
Olá Flavia,
Sim, poderia considerar um erro do algoritmo. Mas essa base de dados é bem ruim e dificilmente vamos chegar em valores melhores 🙁
No final eu comento sobre algumas melhorias que podem ser implementadas. Veja também o curso Processamento de Linguagem Natural com spaCy e Python, que usamos uma base do Twitter em português e conseguimos resultados bem interessantes 🙂
Jones
21 de maio de 2021 at 21:50 #28976
RicTompson
Participant
Considerando base de dados com classes desbalanceadas (nesse exemplo, muito mais classe medo do que alegria), temos que efetuar algum balanceamento prévio ou o Naive Bayes é um algoritmo para isso?
Outra dúvida: Como o Naive Bayes trabalha com probabilidade, é necessário fazer um LabelEncoder para os atributos (como num vídeo demonstrado na IA Expert)? Assim, pensando em probabilidade, não poderia trabalhar sem usar o LabelEncoder para cada atributo nominal, ou seja, trabalhar com o atributo “bruto” mesmo?
24 de maio de 2021 at 21:57 #28992
Fábio Spak
Participant
Olá RicTompson, segue a resposta do instrutor Denny:
No caso de datasets desbalanceados, ainda assim é recomendável fazer o rebalanceamento, ou utilizar alguma modificação do algoritmo que leve isto em consideração. Para o Naive Bayes, encontrei um artigo inteiro tratando deste assunto: https://www.cs.waikato.ac.nz/~eibe/pubs/FrankAndBouckaertPKDD06new.pdf
Sobre o LabelEncoder, vai depender da biblioteca. A biblioteca NLT apresentada no curso não precisa desta etapa, mas outras exigem receber os textos com indicadores numéricos.
26 de maio de 2021 at 17:17 #29013
RicTompson
Participant
Primeiro, parabéns pelo curso! Já tinha pesquisado sobre o Naive Bayes em outros sites (youtube, etc…) e nenhum (pelo menos os que vi) são tão didáticos quanto os vídeos aqui disponibilizados.
Minha dúvida é quanto o atributo renda: Nos vídeos, a renda é classificada por classes (como exemplo, <15.000, >15000, etc). Numa situação real, que tenhamos uma base de dados de, por exemplo, clientes de uma financeira, que todos têm renda diferentes entre si (mesmo que alguns centavos). É necessário reduzir a quantidade de classes desse atributo ou o Naive Bayes trabalha diretamente com o atributo dessa forma (inúmeros valores diferentes de renda)?
30 de maio de 2021 at 14:52 #29050
Fábio Spak
Participant
Olá Ric, ficamos felizes que esteja gostando do curso 🙂 Segue a resposta do instrutor Denny:
“O algoritmo Naive Bayes trabalha com atributos categóricos, então é preciso transformar a renda em faixas, de acordo com alguma regra que faça sentido para o negócio.”
Fabio
- This reply was modified 4 years, 11 months ago by Fábio Spak.
Author
Posts

Viewing 6 posts - 1 through 6 (of 6 total)

You must be logged in to reply to this topic.