Respostas no Fórum
- AutorPosts
Olá Anderson,
Em alguns exercícios o professor não fez o procedimento inteiro para focar nos assuntos específicos de cada módulo, mas seu tratamento está correto. Em um projeto de machine learning, os dados inconsistentes devem ser tratados.
Para comparar dois grupos, geralmente utilizamos o teste t de Student.
19 de setembro de 2022 às 09:38 em resposta a: Erro no código inserção em vetores não ordenados #36792Olá Gilvanio,
Eu testei aqui no PyCharm e deu tudo certo. Pode ser algum problema no seu ambiente de execução, tenta criar um novo ambiente. Se não for isso, é algum problema relacionado ao PyCharm, e não saberia dizer o que está ocasionando isso. Talvez atualizar o programa ajude.
19 de setembro de 2022 às 09:38 em resposta a: Medida de importancia de uma tarefa em relaçao ao todo #36791Olá Shin,
Não entendi bem o que você quer fazer, se a ocupação tem 5 tarefas, o peso não seria simplesmente 100/5 = 20%?
15 de setembro de 2022 às 09:21 em resposta a: Dúvida sobre balanceamento na base para treino #36761Olá Victor,
Na medida do possível sim, caso contrário seu modelo vai ficar mais especializado em apenas uma das classes.
15 de setembro de 2022 às 09:20 em resposta a: Dúvida sobre número de neurônios e camadas ocultas #36760Olá Fabio,
Há um tempo atrás eu escrevi um artigo sobre a conclusão de um pesquisador, mas te confesso que na prática eu acho essa recomendação de pouco valor. Assim como qualquer hiperparâmetro de um modelo, o número ideal acaba sendo descoberto mais na base da tentativa e erro do que partindo de premissas.
Olá Caio,
Quase que certeza que é problema de encoding, tente checar qual é a codificação do arquivo original. Eu uso o program Notepad++ pra isso, dá pra padronizar nele a codificação para UTF-8, isto tende a resolver os problemas.
Olá Luiz,
O Scikit-learn tem um módulo chamado MLPClassifier (multi-layer perceptron), dá uma olhada na documentação: https://scikit-learn.org/stable/modules/generated/sklearn.neural_network.MLPClassifier.html
Olá André,
É um multiplicador de valor menor do que 1 que usamos para que o aprendizado não seja “muito rápido”, sem aplicar esse multiplicador a atualização dos pesos dá pulos muito grandes e corremos o risco de perder o ponto do treinamento onde está o mínimo global.
Olá André, não tem um nome, ela foi criada no início do desenvolvimento das redes neurais e é a forma mais simples de atualizar os pesos.
Olá Jeiverson,
Suas colocações estão corretas, mas a ideia por trás da roleta viciada é de selecionar o indivíduo na posição onde o valor sorteado está mesmo, não o mais próximo. Pense como uma roleta física mesmo, quando a gente gira, a escolha vale para onde a flecha está apontando, não para a fatia mais próxima. O
valor_sorteado
nada mais é do que a posição da flecha, e nós usamos o restante do código para determinar quem é o indivíduo presente naquela porção da roleta.Olá Adauto,
No caso de valores categóricos, você pode optar por usar o valor mais frequente. Você descobre isso selecionando a coluna e usando o método
value_counts
:base_census['income'].value_counts()
Neste caso, o valor mais frequente é “<=50K”.
Então, você filtra a coluna para os valores faltantes e passa o novo valor:
base_census['income'][base_census['income'].isna()] = "<=50K"
Veja que essa expressão está dentro de um loop for, onde o valor de
i
muda a cada loop.i
indica o número da linha em convites, começa na primeira e vai até o final. Então, em cada loop,conexoes['Full Name']
tem que ser igual aconvites['From']
na linha/posiçãoi
. Se for, isto retornaTrue
. econexoes[conexoes[‘Full Name’] == convites[‘From’][i]]
vai retornar as linhas inteiras deconexoes
que cumprem o critério. Aí, nós usamos['Company']
pra filtrar só esta coluna (nome da empresa),values
para converter para numpy array e o índice[0]
para recuperar a primeira entrada deste array.Se te ajudar a entender, desmonte essa linha e printe os resultados passo a passo:
tmp = conexoes[‘Full Name’] == convites[‘From’][i] print(tmp) tmp = conexoes[tmp] print(tmp) tmp = tmp['Company'] print(tmp) tmp = tmp.values print(tmp) company = tmp[0] print(company)
- Esta resposta foi modificada 2 anos, 7 meses atrás por
Denny Ceccon.
Você precisa trocar os parênteses por colchetes na definição de semstop:
(p for p in palavras.split() if p not in stopwordsnltk)
=>[p for p in palavras.split() if p not in stopwordsnltk]
Olá Caio.
A expressão dentro dos colchetes externos,
conexoes[‘Full Name’] == convites[‘From’][i]
, está checando se a informação que consta emconexoes['Full Name']
é igual aconvites['From']
na linhai
. Se for, esta comparação vai retornarTrue
, entãoconexoes[conexoes[‘Full Name’] == convites[‘From’][i]]
vai resultar ns entradas deconexoes
identificadas comoTrue
.- Esta resposta foi modificada 2 anos, 8 meses atrás por
Denny Ceccon.
- Esta resposta foi modificada 2 anos, 7 meses atrás por
- AutorPosts