Como utilizar o LabelEncoder e OneHotEncoder em produção ?

Home Fóruns Fórum Machine Learning e Data Science com Python de A à Z Como utilizar o LabelEncoder e OneHotEncoder em produção ?

Visualizando 4 posts - 1 até 4 (de 4 do total)
  • Autor
    Posts
  • #32181

    Olá Prof,

    Sobre os encoders: LabelEncoder e OneHotEncoder, quando criamos um label encoder, para uma coluna categorica no treino, e, depois quando vamos aplicar em produção, para o algoritimo funcionar corretamente, pelo que entendi, seria necessário passar o parametro de entrada como o valor numerico criado pelo encoder no treino e não mais a categoria, por exemplo, usando quele do salario (vou usar de exemplo como preditor):

    Os dados originais tem ” >50k” e “<50k”, quando treina se torna 0 (zero) e 1, por exemplo. Em produção, quando formos prever o valor para dados novos devemos informar 0(zero) ou 1 na categoria, correto ?

    E quando temos vários encoders como no exemplo do censu, qual a forma de uso em produção teria como exemplo para trazer ? De repente, salvar todos os encoders também para utilizálos sempre antes de prever algo novo ? Ou como funciona ??

     

    #32209
    Fábio Spak
    Participante

      Olá Sérgio, segue a resposta do instrutor Denny:

      Olá, exatamente, todos os encoders também devem ser salvos para utilização no ambiente de produção, já que todas as transformações dos dados feitas durante o treinamento devem ser reproduzidas na produção. É possível salvá-los facilmente utilizando a biblioteca pickle, mais especificamente o método dump, e depois recarregá-los do disco usando o método load.

       

      Fabio

      #32211

      Hmm, como imaginei.  Obrigado

       

      #44782
      Jones Granatyr
      Moderador

        Qualquer outra dúvida é só avisar!

      Visualizando 4 posts - 1 até 4 (de 4 do total)
      • Você deve fazer login para responder a este tópico.