Forum Replies Created

Viewing 15 posts - 331 through 345 (of 402 total)
  • Author
    Posts
  • in reply to: Algoritmo PCA #35647
    Denny Ceccon
    Moderator

      Ah sim, neste caso ele está calculado a distância de cosseno entre dois registros, transformando os dados originais nas distâncias entre eles. Isto significa transformar uma tabela onde cada registro x1, x2, … xn, representado por var_1, var_2, …, var_n, em uma matriz quadrada de tamanho xn x xn com a distância de cosseno entre cada registro. O mesmo poderia ser feito para distância euclidiana ou qualquer outra medida de distância, seguida de PCA.

      A distância de cosseno geralmente é utilizada em alguns contextos específicos, principalmente para representar similaridade entre embeddings, ou seja, dados codificados produzidos por uma rede neural. Com dados brutos, como é o caso deste exemplo, é muito raro utilizar porque a distância de cosseno não costuma significar alguma coisa de valor prático, mas neste caso, pela conclusão do autor, parece que ela foi útil na clusterização.

      Em machine learning, muitas transformações dos dados não são muito intuitivas, e a gente acaba descobrindo seu valor testando e vendo se os resultados fazem algum sentido. Este parece ser o caso.

      in reply to: Algoritmo PCA #35645
      Denny Ceccon
      Moderator

        Olá Fogaça,

        Esse processamento me parece estranho, pois a distância de cosseno vai resultar em um valor único, ou seja, X terá uma única variável, e o PCA de uma única variável é esta própria variável; você nem consegue fazer um PCA com 2 componentes neste caso.

        Se você puder indicar algum exemplo de onde viu isso, eu posso dar uma checada mais aprofundada.

        in reply to: Analise Exploratória de Dados – AED #35644
        Denny Ceccon
        Moderator

          Olá José,

          Não tem uma resposta pronta. Eu certamente faria primeiro uma análise de cada dataset individual, para tentar descobrir informações isoladas sobre os clientes, ou sobre as ordens, ou sobre os pagamentos, e depois faria uma nova análise com todos os dados agrupados, para tentar evidenciar algumas correlações.

          Denny Ceccon
          Moderator

            Olá Wesley.

            Isso mesmo. Seu score, calculado com base na sua solução, consta no lado direito, e você pode ver sua posição na competição no link Jump to…

            in reply to: Redes neurais convolucionais #35364
            Denny Ceccon
            Moderator

              Ela usa todos, mas os neurônios dão pesos diferentes a cada atributo relacionado aos mapas.

              • This reply was modified 2 years, 10 months ago by Denny Ceccon.
              in reply to: Redes neurais convolucionais #35339
              Denny Ceccon
              Moderator

                Sim Caio, o pooling serve para acentuar alguns sinais obtidos pelas camadas de convolução, e depois que eles são concatenados, todos eles são utilizados na fase de classificação.

                in reply to: Step function/Perceptron #35324
                Denny Ceccon
                Moderator

                  Olá Luis,

                  Imagine por exemplo que você quer que a rede neural retorne “sim” ou “não” para predizer se vai chover. Se vai chover qualquer quantidade, ela tem que retornar simplesmente “sim”, se não vai chover nada ela retorna “não”. Aí seria um caso onde a step function resolve.

                  in reply to: Bias #35267
                  Denny Ceccon
                  Moderator

                    Não, em todos. Na verdade quando as redes neurais fazem classificação, elas tratam como regressão até a última etapa, e só no final transformam a predição em uma classe.

                    in reply to: Detectar discurso de ódio #35265
                    Denny Ceccon
                    Moderator

                      Você também precisaria treinar o mesmo modelo com o dataset rotulado com o assunto.

                      in reply to: grid search #35245
                      Denny Ceccon
                      Moderator

                        Oi Caio,

                        Não, são dois processos separados.

                        in reply to: Bias #35244
                        Denny Ceccon
                        Moderator

                          Oi Caio,

                          Imagine que você está fazendo uma regressão linear com somente um atributo. Sem o bias, esta regressão deve necessariamente passar pela origem, ou seja, o ponto (0, 0), mas nem sempre isso é desejável. O bias serve para “deslocar a origem” para outro ponto de y, e assim produzir uma regressão mais adequada. Como na figura abaixo:

                           

                          in reply to: Detectar discurso de ódio #35243
                          Denny Ceccon
                          Moderator

                            Olá Fabio,

                            Quanto mais específico o dataset pra seu problema de interesse, melhor costuma ser o desempenho. Você pode testar com este dataset e verificar se está satisfeito com os resultados antes de tentar com outro.

                            in reply to: dropout #35242
                            Denny Ceccon
                            Moderator

                              Oi Caio,

                              Infelizmente não existe uma resposta pronta para essa pergunta, pois depende muito das características do problema e se o modelo escolhido é de fato adequado para ele, o que é muito difícil de dizer com certeza. O que se costuma falar muito em machine learning é na ideia do trade-off, em algumas situações nós temos que encontrar um equilíbrio entre, por exemplo, o desvio padrão e a acurácia. Se o desvio está muito “alto”, vale a pena aplicar dropout para reduzir a probabilidade de overfitting, mas assim a gente pode sacrificar um pouco da acurácia. A solução final vai depender de uma série de fatores como a experiência do desenvolvedor e a área de aplicação da IA.

                              in reply to: Erro ao gerar a camada Bert #35081
                              Denny Ceccon
                              Moderator

                                Não precisa fazer downgrade, a versão 2.8.0 ainda está funcional.

                                in reply to: Erro ao gerar a camada Bert #35079
                                Denny Ceccon
                                Moderator

                                  Olá Aislan,

                                  Eu tentei rodar o notebook do Colab com a versão 2.8.0 do Tensorflow mesmo (a que é atualmente instalada por padrão no Colab) e não teve problemas. Você só deve fazer o downgrade se tiver problemas com a versão atual.

                                Viewing 15 posts - 331 through 345 (of 402 total)