Home › Fóruns › Fórum Machine Learning e Data Science com Python de A à Z › Tratamento de Valores inconsistentes e faltantes
- Este tópico contém 4 respostas, 2 vozes e foi atualizado pela última vez 9 meses, 2 semanas atrás por
Denny Ceccon.
- AutorPosts
- 14 de agosto de 2022 às 14:20 #36346
adautosalmeida
ParticipanteExiste algum padrão de ordem a ser seguido para identificar esses valores? Ou algum comando das bibliotecas que já possa ser aplicado logo na base para identifica-los? Pois nas aulas eles so foram percebidos depois que foi feito os primeiros gráficos. Em uma situação real de analise qual seria o passo a passo para realizar as operações?
14 de agosto de 2022 às 18:02 #36349adautosalmeida
ParticipanteComo por exemplo para os valores NaN eu rodei esse codigo e ele me retornou todos valores NaN da base:
base_credit[base_credit.isnull().any(axis=1)]
Existe algum nesse mesmo padrão que poderia identificar os outliers das idades negativas sem a necessidade de fazer os gráficos?
15 de agosto de 2022 às 15:21 #36354Denny Ceccon
ModeradorOlá Adauto,
Infelizmente não porque a própria definição de outlier é aberta a interpretações. Por exemplo, idades negativas certamente estão erradas, mas e se a variável permitisse valores negativos? Esta parte inicial de exploração dos dados fica a cargo do desenvolvedor e inclusive é essencial para o desenvolvimento de um bom projeto de Data Science.
15 de agosto de 2022 às 18:00 #36361adautosalmeida
ParticipanteEntendi, Denny.
De fato eu andei revisando os códigos e como estou tendo os primeiros contatos com DS, eu optei por “traçar um passo a passo”, com as possibilidades que foram passados nesses exemplos. Agora eu irei praticar e testar isso em outra base checando com esse meu “passo a passo”. Isso é só para eu realmente ter em mente as possibilidades e não deixar passar nada.
Obrigado
15 de agosto de 2022 às 19:13 #36362Denny Ceccon
ModeradorÉ um bom caminho Adauto, com a experiência você vai aprendendo a lidar com essas inconsistências de uma forma mais eficiente.
- AutorPosts
- Você deve fazer login para responder a este tópico.