Respostas no Fórum

Visualizando 15 posts - 271 até 285 (de 403 do total)
  • Autor
    Posts
  • em resposta a: Busca Gulosa #36907
    Denny Ceccon
    Moderador

      Olá Flavia,

      Isso mesmo. As heurísticas que usamos nos algoritmos de busca geralmente nos ajudam, mas não são perfeitos, então eles correm o risco de convergir para uma solução inválida.

      em resposta a: Exercicio_01 – População e amostra #36881
      Denny Ceccon
      Moderador

        Olá Anderson,

        Em alguns exercícios o professor não fez o procedimento inteiro para focar nos assuntos específicos de cada módulo, mas seu tratamento está correto. Em um projeto de machine learning, os dados inconsistentes devem ser tratados.

        em resposta a: Teste de hipótese – Dúvida #36880
        Denny Ceccon
        Moderador

          Para comparar dois grupos, geralmente utilizamos o teste t de Student.

          em resposta a: Erro no código inserção em vetores não ordenados #36792
          Denny Ceccon
          Moderador

            Olá Gilvanio,

            Eu testei aqui no PyCharm e deu tudo certo. Pode ser algum problema no seu ambiente de execução, tenta criar um novo ambiente. Se não for isso, é algum problema relacionado ao PyCharm, e não saberia dizer o que está ocasionando isso. Talvez atualizar o programa ajude.

            em resposta a: Medida de importancia de uma tarefa em relaçao ao todo #36791
            Denny Ceccon
            Moderador

              Olá Shin,

              Não entendi bem o que você quer fazer, se a ocupação tem 5 tarefas, o peso não seria simplesmente 100/5 = 20%?

              em resposta a: Dúvida sobre balanceamento na base para treino #36761
              Denny Ceccon
              Moderador

                Olá Victor,

                Na medida do possível sim, caso contrário seu modelo vai ficar mais especializado em apenas uma das classes.

                em resposta a: Dúvida sobre número de neurônios e camadas ocultas #36760
                Denny Ceccon
                Moderador

                  Olá Fabio,

                  Há um tempo atrás eu escrevi um artigo sobre a conclusão de um pesquisador, mas te confesso que na prática eu acho essa recomendação de pouco valor. Assim como qualquer hiperparâmetro de um modelo, o número ideal acaba sendo descoberto mais na base da tentativa e erro do que partindo de premissas.

                  em resposta a: base de dados #36748
                  Denny Ceccon
                  Moderador

                    Olá Caio,

                    Quase que certeza que é problema de encoding, tente checar qual é a codificação do arquivo original. Eu uso o program Notepad++ pra isso, dá pra padronizar nele a codificação para UTF-8, isto tende a resolver os problemas.

                    em resposta a: Como montar a rede usando o scikit-lean #36563
                    Denny Ceccon
                    Moderador

                      Olá Luiz,

                      O Scikit-learn tem um módulo chamado MLPClassifier (multi-layer perceptron), dá uma olhada na documentação: https://scikit-learn.org/stable/modules/generated/sklearn.neural_network.MLPClassifier.html

                      em resposta a: Taxa De Aprendizagem #36562
                      Denny Ceccon
                      Moderador

                        Olá André,

                        É um multiplicador de valor menor do que 1 que usamos para que o aprendizado não seja “muito rápido”, sem aplicar esse multiplicador a atualização dos pesos dá pulos muito grandes e corremos o risco de perder o ponto do treinamento onde está o mínimo global.

                        em resposta a: Qual o nome dessa formula ? de onde vem ? #36561
                        Denny Ceccon
                        Moderador

                          Olá André, não tem um nome, ela foi criada no início do desenvolvimento das redes neurais e é a forma mais simples de atualizar os pesos.

                          em resposta a: Erro na função “seleciona_pai”. #36530
                          Denny Ceccon
                          Moderador

                            Olá Jeiverson,

                            Suas colocações estão corretas, mas a ideia por trás da roleta viciada é de selecionar o indivíduo na posição onde o valor sorteado está mesmo, não o mais próximo. Pense como uma roleta física mesmo, quando a gente gira, a escolha vale para onde a flecha está apontando, não para a fatia mais próxima. O valor_sorteado nada mais é do que a posição da flecha, e nós usamos o restante do código para determinar quem é o indivíduo presente naquela porção da roleta.

                            em resposta a: AULA BASE DE DADOS CENSUS #36523
                            Denny Ceccon
                            Moderador

                              Olá Adauto,

                              No caso de valores categóricos, você pode optar por usar o valor mais frequente. Você descobre isso selecionando a coluna e usando o método value_counts:

                              base_census['income'].value_counts()

                              Neste caso, o valor mais frequente é “<=50K”.

                              Então, você filtra a coluna para os valores faltantes e passa o novo valor:

                              base_census['income'][base_census['income'].isna()] = "<=50K"

                              em resposta a: 2 tópico aula 10 #36516
                              Denny Ceccon
                              Moderador

                                Veja que essa expressão está dentro de um loop for, onde o valor de i muda a cada loop. i indica o número da linha em convites, começa na primeira e vai até o final. Então, em cada loop, conexoes['Full Name'] tem que ser igual a convites['From'] na linha/posição i. Se for, isto retorna True. e conexoes[conexoes[‘Full Name’] == convites[‘From’][i]] vai retornar as linhas inteiras de conexoes que cumprem o critério. Aí, nós usamos ['Company'] pra filtrar só esta coluna (nome da empresa), values para converter para numpy array e o índice [0] para recuperar a primeira entrada deste array.

                                Se te ajudar a entender, desmonte essa linha e printe os resultados passo a passo:

                                tmp = conexoes[‘Full Name’] == convites[‘From’][i]
                                print(tmp)
                                tmp = conexoes[tmp]
                                print(tmp)
                                tmp = tmp['Company']
                                print(tmp)
                                tmp = tmp.values
                                print(tmp)
                                company = tmp[0]
                                print(company)

                                 

                                 

                                • Esta resposta foi modificada 2 anos, 9 meses atrás por Denny Ceccon.
                                em resposta a: Generator #36497
                                Denny Ceccon
                                Moderador

                                  Você precisa trocar os parênteses por colchetes na definição de semstop:

                                  (p for p in palavras.split() if p not in stopwordsnltk) => [p for p in palavras.split() if p not in stopwordsnltk]

                                Visualizando 15 posts - 271 até 285 (de 403 do total)