Tokenização em português com BERT

Home Fóruns Fórum Processamento de Linguagem Natural com BERT e Python Tokenização em português com BERT

Marcado: 

Visualizando 4 posts - 1 até 4 (de 4 do total)
  • Autor
    Posts
  • #21463
    Danilo
    Aluno

    olá, sobre a aula de sentimentos com BERT, estou tentando fazer um exemplo com tweets em português.

    Infelizmente no site https://tfhub.dev/ não encontrei os modelos com os pesos em português.

    Existe alguma alternativa para este caso?

     

     

     

     

    #21468
    Profile photo ofjonesJones Granatyr
    Moderador

    Olá Danilo,

    Diretamente no TensorFlow acredito que não tenha mesmo. Veja este link

    https://github.com/neuralmind-ai/portuguese-bert

    Jones

    #21474
    Danilo
    Aluno

    oi Jones, obrigado

    como adapto aquele arquivo pré treinado ao modelo?

    No código, usamos um link:

     self.bert_layer = hub.KerasLayer('https://tfhub.dev/tensorflow/bert_en_uncased_L-12_H-768_A-12/1',
    trainable = False)

    qual destes arquivos devo baixar e como o adapto para o código acima?

    TensorFlow checkpoint/PyTorch checkpoint/Vocabulary

    BERTimbau Base (aka bert-base-portuguese-cased)

    BERTimbau Large (aka bert-large-portuguese-cased)

    #21477
    Profile photo ofjonesJones Granatyr
    Moderador

    Pior que não sei dizer ao certo, que não cheguei a testar essa versão em PT 🙁

    Acho que ela apareceu depois que o curso foi gravado

Visualizando 4 posts - 1 até 4 (de 4 do total)
  • Você deve fazer login para responder a este tópico.