Home › Fóruns › Fórum Machine Learning e Data Science com Python de A à Z › Como utilizar o LabelEncoder e OneHotEncoder em produção ?
Marcado: Atributos categóricos – LabelEncoder
- Este tópico contém 3 respostas, 3 vozes e foi atualizado pela última vez 9 meses atrás por
Jones Granatyr.
- AutorPosts
- 31 de outubro de 2021 às 16:51 #32181
Olá Prof,
Sobre os encoders: LabelEncoder e OneHotEncoder, quando criamos um label encoder, para uma coluna categorica no treino, e, depois quando vamos aplicar em produção, para o algoritimo funcionar corretamente, pelo que entendi, seria necessário passar o parametro de entrada como o valor numerico criado pelo encoder no treino e não mais a categoria, por exemplo, usando quele do salario (vou usar de exemplo como preditor):
Os dados originais tem ” >50k” e “<50k”, quando treina se torna 0 (zero) e 1, por exemplo. Em produção, quando formos prever o valor para dados novos devemos informar 0(zero) ou 1 na categoria, correto ?
E quando temos vários encoders como no exemplo do censu, qual a forma de uso em produção teria como exemplo para trazer ? De repente, salvar todos os encoders também para utilizálos sempre antes de prever algo novo ? Ou como funciona ??
3 de novembro de 2021 às 09:09 #32209Olá Sérgio, segue a resposta do instrutor Denny:
Olá, exatamente, todos os encoders também devem ser salvos para utilização no ambiente de produção, já que todas as transformações dos dados feitas durante o treinamento devem ser reproduzidas na produção. É possível salvá-los facilmente utilizando a biblioteca pickle, mais especificamente o método dump, e depois recarregá-los do disco usando o método load.
Fabio
3 de novembro de 2021 às 10:20 #32211Hmm, como imaginei. Obrigado
11 de maio de 2024 às 09:47 #44782Qualquer outra dúvida é só avisar!
- AutorPosts
- Você deve fazer login para responder a este tópico.