Naive Bayes em texto II | IA Expert Academy

Tagged: Naive Bayes em texto II

This topic has 5 replies, 4 voices, and was last updated 5 years, 1 month ago by Fábio Spak.

Viewing 6 posts - 1 through 6 (of 6 total)

Author

Posts
22 de setembro de 2020 at 07:49 #20814
Flavia
Participant
No vídeo Naive Bayes em texto II.

O algoritmo classificou a frase como alegria em 69% e 31% em medo. A frase ao ler seria de medo, neste caso seria um erro do algoritmo? Teria que ter mais treinamento para então ter uma resposta coerente e eficácia?

att,
- This topic was modified 5 years, 10 months ago by Flavia.
22 de setembro de 2020 at 17:07 #20820
Jones Granatyr
Keymaster
Olá Flavia,

Sim, poderia considerar um erro do algoritmo. Mas essa base de dados é bem ruim e dificilmente vamos chegar em valores melhores 🙁

No final eu comento sobre algumas melhorias que podem ser implementadas. Veja também o curso Processamento de Linguagem Natural com spaCy e Python, que usamos uma base do Twitter em português e conseguimos resultados bem interessantes 🙂

Jones
21 de maio de 2021 at 21:50 #28976
RicTompson
Participant
Considerando base de dados com classes desbalanceadas (nesse exemplo, muito mais classe medo do que alegria), temos que efetuar algum balanceamento prévio ou o Naive Bayes é um algoritmo para isso?

Outra dúvida: Como o Naive Bayes trabalha com probabilidade, é necessário fazer um LabelEncoder para os atributos (como num vídeo demonstrado na IA Expert)? Assim, pensando em probabilidade, não poderia trabalhar sem usar o LabelEncoder para cada atributo nominal, ou seja, trabalhar com o atributo “bruto” mesmo?
24 de maio de 2021 at 21:57 #28992
Fábio Spak
Participant
Olá RicTompson, segue a resposta do instrutor Denny:

No caso de datasets desbalanceados, ainda assim é recomendável fazer o rebalanceamento, ou utilizar alguma modificação do algoritmo que leve isto em consideração. Para o Naive Bayes, encontrei um artigo inteiro tratando deste assunto: https://www.cs.waikato.ac.nz/~eibe/pubs/FrankAndBouckaertPKDD06new.pdf

Sobre o LabelEncoder, vai depender da biblioteca. A biblioteca NLT apresentada no curso não precisa desta etapa, mas outras exigem receber os textos com indicadores numéricos.
26 de maio de 2021 at 17:17 #29013
RicTompson
Participant
Primeiro, parabéns pelo curso! Já tinha pesquisado sobre o Naive Bayes em outros sites (youtube, etc…) e nenhum (pelo menos os que vi) são tão didáticos quanto os vídeos aqui disponibilizados.

Minha dúvida é quanto o atributo renda: Nos vídeos, a renda é classificada por classes (como exemplo, <15.000, >15000, etc). Numa situação real, que tenhamos uma base de dados de, por exemplo, clientes de uma financeira, que todos têm renda diferentes entre si (mesmo que alguns centavos). É necessário reduzir a quantidade de classes desse atributo ou o Naive Bayes trabalha diretamente com o atributo dessa forma (inúmeros valores diferentes de renda)?
30 de maio de 2021 at 14:52 #29050
Fábio Spak
Participant
Olá Ric, ficamos felizes que esteja gostando do curso 🙂 Segue a resposta do instrutor Denny:

“O algoritmo Naive Bayes trabalha com atributos categóricos, então é preciso transformar a renda em faixas, de acordo com alguma regra que faça sentido para o negócio.”

Fabio
- This reply was modified 5 years, 1 month ago by Fábio Spak.
Author

Posts

Viewing 6 posts - 1 through 6 (of 6 total)

You must be logged in to reply to this topic.