Home › Fóruns › Fórum Processamento de Linguagem Natural com BERT e Python › Classificação
- Este tópico contém 1 resposta, 2 vozes e foi atualizado pela última vez 3 anos, 3 meses atrás por Fábio Spak.
- AutorPosts
- 20 de agosto de 2021 às 22:59 #30134
Boa noite!
Professor, queria colocar em prática o conhecimento na prática mais estou com dúvida sobre como usar.
Problema: Tenho que fazer um saneamento em uma base de dados e visitar cada cliente dessa base, o problema é criar uma melhor roteirização uma vez q não tenho as coordenadas desses clientes somente informações do cadastro (município, enderenço, ponto de referencia) .
Minha ideia seria criar um classificador tipo criado no curso só que invés de sentimento seria de localização ou zoneamento.
- Queria saber se o BERT seria a melhor tecnologia para esse problema, uma vez, que teria centenas classes target(lot1, lot2, lot3… lotn)?
- Outra dúvida seria tipo teria que fazer algum tratamento nas palavras tipo (Acailandia, Açailandia, Acailândia, ACL, converter para Açailândia), uma vez que essa informação é importante para a localização.
23 de agosto de 2021 às 23:07 #30165Olá Guilherme, segue o comentário do Denny:
Não tenho conhecimento de aplicações do BERT num contexto assim, mas acho que seria muito mais prático aplicar uma correção na base de dados para padronizar as nomenclaturas, e depois fazer um agrupamento usando a técnica bag of words, já que cada loteamento teria exatamente as mesmas palavras na sua descrição. A parte mais trabalhosa seria com a padronização, mas para não precisar de regras explícitas ele poderia de fato retirar acentuação, colocar em minúsculo e usar alguma técnica de stemmização, talvez isso já ajude o suficiente, entretanto são necessário realizar testes.
Fabio
- AutorPosts
- Você deve fazer login para responder a este tópico.