Home › Fóruns › Fórum Processamento de Linguagem Natural com BERT e Python › Tokenização em português com BERT
Marcado: Tokenização
- Este tópico contém 11 respostas, 7 vozes e foi atualizado pela última vez 9 meses, 1 semana atrás por
Denny Ceccon.
- AutorPosts
- 11 de outubro de 2020 às 11:54 #21463
olá, sobre a aula de sentimentos com BERT, estou tentando fazer um exemplo com tweets em português.
Infelizmente no site https://tfhub.dev/ não encontrei os modelos com os pesos em português.
Existe alguma alternativa para este caso?
12 de outubro de 2020 às 09:38 #21468Olá Danilo,
Diretamente no TensorFlow acredito que não tenha mesmo. Veja este link
https://github.com/neuralmind-ai/portuguese-bert
Jones
12 de outubro de 2020 às 13:42 #21474oi Jones, obrigado
como adapto aquele arquivo pré treinado ao modelo?
No código, usamos um link:
self.bert_layer = hub.KerasLayer('https://tfhub.dev/tensorflow/bert_en_uncased_L-12_H-768_A-12/1', trainable = False)
qual destes arquivos devo baixar e como o adapto para o código acima?
TensorFlow checkpoint/PyTorch checkpoint/Vocabulary
BERTimbau Base (aka bert-base-portuguese-cased)
BERTimbau Large (aka bert-large-portuguese-cased)
12 de outubro de 2020 às 16:29 #21477Pior que não sei dizer ao certo, que não cheguei a testar essa versão em PT 🙁
Acho que ela apareceu depois que o curso foi gravado
5 de dezembro de 2020 às 15:38 #22580Jones,
Boa tarde,
Você tem alguma aula indicando como podemos criar nosso próprio modelo, com os pesos e ajustes ?
E é possível irmos incrementando o modelo adicionando dados, para por exemplo deixar ele rodando com um web crawler e ir aprendendo de determinadas buscas que queremos ?
Se puder orientar se existe algo, talvez em algum dos seus cursos, ou nesse e que possa ser usado também com a arquitetura do BERT e para chat bots, com outras arquiteturas eu agradeço demais.
Abraços,
7 de dezembro de 2020 às 10:36 #22599Olá Jefferson,
Já respondi lá no outro tópico
Jones
27 de abril de 2021 às 17:59 #28509Boa tarde pessoal!
Alguém conseguiu fazer o modelo em PT usando base do BERTimbau?
27 de abril de 2021 às 22:16 #28514Olá Bruno, ainda não implementamos por aqui 🙁
Você pode consultar algumas informações nesses ebook da Springer, mas é pago…
https://link.springer.com/chapter/10.1007/978-3-030-61377-8_28
Fabio
7 de fevereiro de 2023 às 19:08 #39561Prezado Fabio, seria interessante um complemento no curso, enfrento mesmo caso que os colegas, comprei o curso para uso em português até chego a lhe fazer uma sugestão, sendo essa a língua do curso os exemplos deveriam ser usando textos na língua portuguesa. Caso seja possível crie um complemento e exemplo para uso em português. Obrigado
8 de fevereiro de 2023 às 12:37 #39571Obrigado pela sugestão! Vamos considerar fazer um módulo adicional
10 de fevereiro de 2023 às 21:05 #39615Obrigado, teria como disponibilizar até lá, somente um script anotado, como faria para para fazer um treinamento não pelo squad mais sim por um arquivo csv.
7 de maio de 2024 às 09:14 #44712Vamos considerar isso em uma atualização do curso.
- AutorPosts
- Você deve fazer login para responder a este tópico.