- This topic has 1 reply, 2 voices, and was last updated 2 years, 8 months ago by .
Viewing 2 posts - 1 through 2 (of 2 total)
Viewing 2 posts - 1 through 2 (of 2 total)
- You must be logged in to reply to this topic.
Home › Forums › Fórum Ciência de Dados para Empresas e Negócios › Dúvidas Gerais
Olá amigos, boa tarde,
Alguém poderia me ajudar nessas dúvidas? Se a dúvida for simples ou banal, me perdoem amigos e amigas.
DÚVIDA NUMERO 1: Por que é necessário utilizar os dois “colchetes” na criação da variável “X_cat”?
X_cat = reviews_df[[‘variation’]]
DÚVIDA NUMERO 2: Por que na criação da variável “negative” se faz referência DUAS VEZES ao “reviews_df” (nome do Data Frame) e na criação da variável “sentences” só faz referência UMA VEZ ao “reviews_df” (nome do Data Frame)?
NEGATIVE = reviews_df[reviews_df[‘feedback’] == 0
SENTENCES = reviews_df[‘verifield_reviews’].tolist()
Olá Gustavo,
No primeiro caso, quando queremos escolher mais do que uma coluna, precisamos usar a notação de duplo colchetes, mas para uma coluna só, tanto faz.
No segundo, a notação dentro do colchetes retorna um vetor com valores booleanos, indicando onde os resultados da coluna feedback são iguais a zero, e depois essa “máscara” é aplicada a reviews_df para recuperar apenas os registros que atendem a esta condição.