Forum Replies Created

Viewing 15 posts - 271 through 285 (of 404 total)
  • Author
    Posts
  • in reply to: Medida de importancia de uma tarefa em relaçao ao todo #36908
    Denny Ceccon
    Moderator

      Acho que você poderia substituir todos os espaços por um underscore, assim o TF-IDF Vectorizer do Sklearn, por exemplo, vai considerar que cada tarefa inteira é uma palavra só.

      in reply to: Busca Gulosa #36907
      Denny Ceccon
      Moderator

        Olá Flavia,

        Isso mesmo. As heurísticas que usamos nos algoritmos de busca geralmente nos ajudam, mas não são perfeitos, então eles correm o risco de convergir para uma solução inválida.

        in reply to: Exercicio_01 – População e amostra #36881
        Denny Ceccon
        Moderator

          Olá Anderson,

          Em alguns exercícios o professor não fez o procedimento inteiro para focar nos assuntos específicos de cada módulo, mas seu tratamento está correto. Em um projeto de machine learning, os dados inconsistentes devem ser tratados.

          in reply to: Teste de hipótese – Dúvida #36880
          Denny Ceccon
          Moderator

            Para comparar dois grupos, geralmente utilizamos o teste t de Student.

            in reply to: Erro no código inserção em vetores não ordenados #36792
            Denny Ceccon
            Moderator

              Olá Gilvanio,

              Eu testei aqui no PyCharm e deu tudo certo. Pode ser algum problema no seu ambiente de execução, tenta criar um novo ambiente. Se não for isso, é algum problema relacionado ao PyCharm, e não saberia dizer o que está ocasionando isso. Talvez atualizar o programa ajude.

              in reply to: Medida de importancia de uma tarefa em relaçao ao todo #36791
              Denny Ceccon
              Moderator

                Olá Shin,

                Não entendi bem o que você quer fazer, se a ocupação tem 5 tarefas, o peso não seria simplesmente 100/5 = 20%?

                in reply to: Dúvida sobre balanceamento na base para treino #36761
                Denny Ceccon
                Moderator

                  Olá Victor,

                  Na medida do possível sim, caso contrário seu modelo vai ficar mais especializado em apenas uma das classes.

                  in reply to: Dúvida sobre número de neurônios e camadas ocultas #36760
                  Denny Ceccon
                  Moderator

                    Olá Fabio,

                    Há um tempo atrás eu escrevi um artigo sobre a conclusão de um pesquisador, mas te confesso que na prática eu acho essa recomendação de pouco valor. Assim como qualquer hiperparâmetro de um modelo, o número ideal acaba sendo descoberto mais na base da tentativa e erro do que partindo de premissas.

                    in reply to: base de dados #36748
                    Denny Ceccon
                    Moderator

                      Olá Caio,

                      Quase que certeza que é problema de encoding, tente checar qual é a codificação do arquivo original. Eu uso o program Notepad++ pra isso, dá pra padronizar nele a codificação para UTF-8, isto tende a resolver os problemas.

                      in reply to: Como montar a rede usando o scikit-lean #36563
                      Denny Ceccon
                      Moderator

                        Olá Luiz,

                        O Scikit-learn tem um módulo chamado MLPClassifier (multi-layer perceptron), dá uma olhada na documentação: https://scikit-learn.org/stable/modules/generated/sklearn.neural_network.MLPClassifier.html

                        in reply to: Taxa De Aprendizagem #36562
                        Denny Ceccon
                        Moderator

                          Olá André,

                          É um multiplicador de valor menor do que 1 que usamos para que o aprendizado não seja “muito rápido”, sem aplicar esse multiplicador a atualização dos pesos dá pulos muito grandes e corremos o risco de perder o ponto do treinamento onde está o mínimo global.

                          in reply to: Qual o nome dessa formula ? de onde vem ? #36561
                          Denny Ceccon
                          Moderator

                            Olá André, não tem um nome, ela foi criada no início do desenvolvimento das redes neurais e é a forma mais simples de atualizar os pesos.

                            in reply to: Erro na função “seleciona_pai”. #36530
                            Denny Ceccon
                            Moderator

                              Olá Jeiverson,

                              Suas colocações estão corretas, mas a ideia por trás da roleta viciada é de selecionar o indivíduo na posição onde o valor sorteado está mesmo, não o mais próximo. Pense como uma roleta física mesmo, quando a gente gira, a escolha vale para onde a flecha está apontando, não para a fatia mais próxima. O valor_sorteado nada mais é do que a posição da flecha, e nós usamos o restante do código para determinar quem é o indivíduo presente naquela porção da roleta.

                              in reply to: AULA BASE DE DADOS CENSUS #36523
                              Denny Ceccon
                              Moderator

                                Olá Adauto,

                                No caso de valores categóricos, você pode optar por usar o valor mais frequente. Você descobre isso selecionando a coluna e usando o método value_counts:

                                base_census['income'].value_counts()

                                Neste caso, o valor mais frequente é “<=50K”.

                                Então, você filtra a coluna para os valores faltantes e passa o novo valor:

                                base_census['income'][base_census['income'].isna()] = "<=50K"

                                in reply to: 2 tópico aula 10 #36516
                                Denny Ceccon
                                Moderator

                                  Veja que essa expressão está dentro de um loop for, onde o valor de i muda a cada loop. i indica o número da linha em convites, começa na primeira e vai até o final. Então, em cada loop, conexoes['Full Name'] tem que ser igual a convites['From'] na linha/posição i. Se for, isto retorna True. e conexoes[conexoes[‘Full Name’] == convites[‘From’][i]] vai retornar as linhas inteiras de conexoes que cumprem o critério. Aí, nós usamos ['Company'] pra filtrar só esta coluna (nome da empresa), values para converter para numpy array e o índice [0] para recuperar a primeira entrada deste array.

                                  Se te ajudar a entender, desmonte essa linha e printe os resultados passo a passo:

                                  tmp = conexoes[‘Full Name’] == convites[‘From’][i]
                                  print(tmp)
                                  tmp = conexoes[tmp]
                                  print(tmp)
                                  tmp = tmp['Company']
                                  print(tmp)
                                  tmp = tmp.values
                                  print(tmp)
                                  company = tmp[0]
                                  print(company)

                                   

                                   

                                  • This reply was modified 3 years, 3 months ago by Denny Ceccon.
                                Viewing 15 posts - 271 through 285 (of 404 total)