Base de Dados de Sentimentos em Português

Home Fóruns Fórum Processamento de Linguagem Natural com Deep Learning Base de Dados de Sentimentos em Português

Visualizando 2 posts - 1 até 2 (de 2 do total)
  • Autor
    Posts
  • #35909

    Olá Professor, boa noite.

    Gostei muito das aulas principalmente da parte de redes neurais convucionais para PLN.

    Porém fiquei com algumas dúvidas. Eu utilizei todo o seu procedimento e apliquei em minha base de dados de sentimentos em português que eu

    adquiri no site do KAGGLE. Esta base de dados eu estou utilizando no meu trabalho de pos graduação em inteligencia artificial da puc minas.

    Um problema que notei é que a minha base ficou pequena após alguns pré-processamentos que eu fiz:

    |label|count|
    | 1|27266|
    | 0|27446|

    Mas mesmo assim eu consegui atingir um resultado razoável:

    257/257 [==============================] – 1s 2ms/step – loss: 1.6544 – accuracy: 0.7459
    [1.6543807983398438, 0.7459485530853271]

    Minha dúvida seria a seguinte, será que é possível melhorar esses resultados com esses mesmos dados, apenas ajustando os parametros?

    Ou será que é possível gerar dados sintéticos para aumentar o volume de dados e melhor assim o treinamento e a validação ?

    Ou você saberia me indicar uma base dados de sentimentos em português já rodulada?

     

    #35920
    Denny Ceccon
    Moderador

    Olá Daniel,

    Certamente que ajustar os hiperparâmetros pode melhorar o modelo (este processo é chamado de otimização dos hiperparâmetros), mas a melhoria não costuma ser muito significativa, dificilmente você vai sair de 75% para 90% só com isso, por exemplo.

    Muitos problemas se beneficiam de dados sintéticos, mas você deve imaginar como é difícil gerar dados sintéticos para texto, acredito que isso hoje só seja possível utilizando outra inteligência artificial. No meu trabalho, por exemplo, um colega usou o modelo GPT-3 para gerar dados para treinar, com resultados bem satisfatórios.

    Por último, é difícil se manter atualizado sobre bases de dados quando a gente não trabalha diretamente com isso, então minha recomendação seria a mesma que eu faria: pesquisar no Google. 🙂

Visualizando 2 posts - 1 até 2 (de 2 do total)
  • Você deve fazer login para responder a este tópico.