Forum Replies Created

Viewing 1 post (of 1 total)
  • Author
    Posts
  • in reply to: SMOTE para Bases Extremamente Desbalanceadas #44725
    Leandro Duarte
    Participant

      Exato Denny, extremamento desbalanceado mesmo. Meu projeto de pesquisa do doutorado é sobre isso, já verifiquei na literatura que de fato o SMOTE e sua variantes tem limitações em cenários desta complexidade.

      Só para entender o contexto, eu gerei 32 conjuntos de dados sintéticos usando a técnica de Planejamento de Experimentos (DOE) alternando fatores como: % da classe minoritária, função, erro, amostras, entre outros. Alguns ficaram com desbalanceamento na casa de 0,5% e outros 1%.

      Acredito que nesses casos, como a base de 1 amostra minoritária, apenas o ROS (Random Oversampling) possa ser aplicado em conjunto com algum classificador, como Random Forest (RF) por exemplo. Só pra constar, usando ROS+RF nessa base citada consegui ACC máximo de 0,69, que levando em conta o cenário não é tão ruim assim.

      Obrigado, vou deixar este post aqui para que caso alguém já tenha passado por algum exemplo próximo, possa contribuir.

    Viewing 1 post (of 1 total)