Respostas no Fórum

Visualizando 15 posts - 271 até 285 (de 402 do total)
  • Autor
    Posts
  • em resposta a: Exercicio_01 – População e amostra #36881
    Denny Ceccon
    Moderador

      Olá Anderson,

      Em alguns exercícios o professor não fez o procedimento inteiro para focar nos assuntos específicos de cada módulo, mas seu tratamento está correto. Em um projeto de machine learning, os dados inconsistentes devem ser tratados.

      em resposta a: Teste de hipótese – Dúvida #36880
      Denny Ceccon
      Moderador

        Para comparar dois grupos, geralmente utilizamos o teste t de Student.

        em resposta a: Erro no código inserção em vetores não ordenados #36792
        Denny Ceccon
        Moderador

          Olá Gilvanio,

          Eu testei aqui no PyCharm e deu tudo certo. Pode ser algum problema no seu ambiente de execução, tenta criar um novo ambiente. Se não for isso, é algum problema relacionado ao PyCharm, e não saberia dizer o que está ocasionando isso. Talvez atualizar o programa ajude.

          em resposta a: Medida de importancia de uma tarefa em relaçao ao todo #36791
          Denny Ceccon
          Moderador

            Olá Shin,

            Não entendi bem o que você quer fazer, se a ocupação tem 5 tarefas, o peso não seria simplesmente 100/5 = 20%?

            em resposta a: Dúvida sobre balanceamento na base para treino #36761
            Denny Ceccon
            Moderador

              Olá Victor,

              Na medida do possível sim, caso contrário seu modelo vai ficar mais especializado em apenas uma das classes.

              em resposta a: Dúvida sobre número de neurônios e camadas ocultas #36760
              Denny Ceccon
              Moderador

                Olá Fabio,

                Há um tempo atrás eu escrevi um artigo sobre a conclusão de um pesquisador, mas te confesso que na prática eu acho essa recomendação de pouco valor. Assim como qualquer hiperparâmetro de um modelo, o número ideal acaba sendo descoberto mais na base da tentativa e erro do que partindo de premissas.

                em resposta a: base de dados #36748
                Denny Ceccon
                Moderador

                  Olá Caio,

                  Quase que certeza que é problema de encoding, tente checar qual é a codificação do arquivo original. Eu uso o program Notepad++ pra isso, dá pra padronizar nele a codificação para UTF-8, isto tende a resolver os problemas.

                  em resposta a: Como montar a rede usando o scikit-lean #36563
                  Denny Ceccon
                  Moderador

                    Olá Luiz,

                    O Scikit-learn tem um módulo chamado MLPClassifier (multi-layer perceptron), dá uma olhada na documentação: https://scikit-learn.org/stable/modules/generated/sklearn.neural_network.MLPClassifier.html

                    em resposta a: Taxa De Aprendizagem #36562
                    Denny Ceccon
                    Moderador

                      Olá André,

                      É um multiplicador de valor menor do que 1 que usamos para que o aprendizado não seja “muito rápido”, sem aplicar esse multiplicador a atualização dos pesos dá pulos muito grandes e corremos o risco de perder o ponto do treinamento onde está o mínimo global.

                      em resposta a: Qual o nome dessa formula ? de onde vem ? #36561
                      Denny Ceccon
                      Moderador

                        Olá André, não tem um nome, ela foi criada no início do desenvolvimento das redes neurais e é a forma mais simples de atualizar os pesos.

                        em resposta a: Erro na função “seleciona_pai”. #36530
                        Denny Ceccon
                        Moderador

                          Olá Jeiverson,

                          Suas colocações estão corretas, mas a ideia por trás da roleta viciada é de selecionar o indivíduo na posição onde o valor sorteado está mesmo, não o mais próximo. Pense como uma roleta física mesmo, quando a gente gira, a escolha vale para onde a flecha está apontando, não para a fatia mais próxima. O valor_sorteado nada mais é do que a posição da flecha, e nós usamos o restante do código para determinar quem é o indivíduo presente naquela porção da roleta.

                          em resposta a: AULA BASE DE DADOS CENSUS #36523
                          Denny Ceccon
                          Moderador

                            Olá Adauto,

                            No caso de valores categóricos, você pode optar por usar o valor mais frequente. Você descobre isso selecionando a coluna e usando o método value_counts:

                            base_census['income'].value_counts()

                            Neste caso, o valor mais frequente é “<=50K”.

                            Então, você filtra a coluna para os valores faltantes e passa o novo valor:

                            base_census['income'][base_census['income'].isna()] = "<=50K"

                            em resposta a: 2 tópico aula 10 #36516
                            Denny Ceccon
                            Moderador

                              Veja que essa expressão está dentro de um loop for, onde o valor de i muda a cada loop. i indica o número da linha em convites, começa na primeira e vai até o final. Então, em cada loop, conexoes['Full Name'] tem que ser igual a convites['From'] na linha/posição i. Se for, isto retorna True. e conexoes[conexoes[‘Full Name’] == convites[‘From’][i]] vai retornar as linhas inteiras de conexoes que cumprem o critério. Aí, nós usamos ['Company'] pra filtrar só esta coluna (nome da empresa), values para converter para numpy array e o índice [0] para recuperar a primeira entrada deste array.

                              Se te ajudar a entender, desmonte essa linha e printe os resultados passo a passo:

                              tmp = conexoes[‘Full Name’] == convites[‘From’][i]
                              print(tmp)
                              tmp = conexoes[tmp]
                              print(tmp)
                              tmp = tmp['Company']
                              print(tmp)
                              tmp = tmp.values
                              print(tmp)
                              company = tmp[0]
                              print(company)

                               

                               

                              • Esta resposta foi modificada 2 anos, 7 meses atrás por Denny Ceccon.
                              em resposta a: Generator #36497
                              Denny Ceccon
                              Moderador

                                Você precisa trocar os parênteses por colchetes na definição de semstop:

                                (p for p in palavras.split() if p not in stopwordsnltk) => [p for p in palavras.split() if p not in stopwordsnltk]

                                em resposta a: 2 tópico aula 10 #36486
                                Denny Ceccon
                                Moderador

                                  Olá Caio.

                                  A expressão dentro dos colchetes externos, conexoes[‘Full Name’] == convites[‘From’][i], está checando se a informação que consta em conexoes['Full Name'] é igual a convites['From'] na linha i. Se for, esta comparação vai retornar True, então conexoes[conexoes[‘Full Name’] == convites[‘From’][i]] vai resultar ns entradas de conexoes identificadas como True.

                                  • Esta resposta foi modificada 2 anos, 8 meses atrás por Denny Ceccon.
                                Visualizando 15 posts - 271 até 285 (de 402 do total)