Responder a: OneHotEncoder

#31641
Fábio Spak
Participante

Olá Guilherme, segue um complemento do instrutor Denny:

Teria que implementar seu próprio código para isso. Você poderia:

1) juntar todos os valores possíveis em uma variável auxiliar, por exemplo algo do tipo (supondo que sua coluna col esteja em um dataframe df):

aux = set()
for entry in df[col]:
aux.update(entry)

2) montar cada nova coluna com base na variável auxiliar, e alimentar ela com o valor 1 se ela aparece na coluna original, 0 se não aparece:

for val in list(aux):
temp = []
for i in range(len(df)):
temp.append(1 if val in df[col][i] else 0)
df[val] = temp

Fabio