Regressão Lógica

Visualizando 4 posts - 1 até 4 (de 4 do total)
  • Autor
    Posts
  • #29552
    ahand
    Participante

      Olá, Jones
      > Na aula de Regressão Logística, vc usou a variável Idade vs variável binária Pagar ou Não pagar. Mas quando a base de dados tiver, além da variável Idade, outra como Renda como fica? Eu imagino que o gráfico seria bidimensional, não ? E se tiver uma variável categórica como Status Social como fica ? Eu imagino que será preciso primeiro binarizar, não ?
      > Aguardo e obgd
      > abs
      >
      > PS: aproveito para perguntar se é possível corrigir dados inválidos no Orange e como fazer isso ?

      #29684
      Fábio Spak
      Participante

        Olá Ahand, segue resposta do instrutor Denny:
        “Isso mesmo, se tiver mais categorias, um suposto gráfico seria multidimensional, mas eu digo suposto porque nós nem temos como plotar um gráfico com mais que 3 dimensões. Por isso, a plotagem apresentada tem maior valor para demonstrar a técnica, não como ferramenta de visualização em si, já que ela tem essa enorme limitação.
        Sobre as variáveis categóricas você está correto, elas precisam ser binarizadas (no caso de variáveis binárias) ou, mais genericamente, transformadas no formato one-hot, onde cada categoria vira uma nova coluna no dataset.”
        Sobre o tratamentos de dados com o Orange, você pode consultar o link que mostra como fazer isso:
        https://orange3.readthedocs.io/projects/orange-visual-programming/en/latest/loading-your-data/index.html 

        Fabio

        #29759
        ahand
        Participante

          Fábio / Denny

          Obgd pela resposta. Persiste, porém, algumas dúvidas

          • Em Regressão Logística se a variável independente (x) for do tipo categórico e vc precisa binarizar, então como a variável dependente (y) também é binário (por exemplo: Pagar e NãoPagar) … não consigo imaginar a curva S como gráfico. Como fica o gráfico nesse caso ? é do tipo relacional ?
          • O link informado parece que não atende a minha dúvida, pois informa que devo alterar dados inválidos no Excel e depois enviar para o Orange. A dúvida, porém, é se consigo acertar dados errados dentro do Orange. Existe widget para esse propósito, ou devo acertar fora do Orange ?
          #29776
          Fábio Spak
          Participante

            Olá Ahand, segue resposta do instrutor Denny:

            No caso de variáveis categóricas, os pontos no gráfico só podem ocupar as posições (0, 0) – para classe 0 saída 0 – ou, respectivamente, (0, 1), (1, 0) e (1, 1). Acontece que eles vão estar concentrados nos pontos que correspondem às relações entre os dados. Suponha por exemplo que uma categoria esteja associada à saída 1 do sistema 70% das vezes em que ela ocorre no dataset, então 70% dos pontos para x = 1 estarão presentes em (1, 1), e os demais 30% em (1, 0); da mesma forma, se a ausência da categoria estiver relacionada com 65% da saída 0 e 35% da saída 1, teremos 65% dos pontos para x = 0 em (0, 0) e o restante em (0, 1). A curva em si é uma condição imposta pelo modelo, ele sempre vai produzir uma curva, mas suas características de inclinação são adequadas para resultar no menor erro possível considerando os dados. Ou seja, o modelo vai produzir uma curva, ainda que os dados não sejam representados explicitamente desta forma. Como os dados não são uma curva, o erro nunca vai ser zerado, mas meramente minimizado, que é exatamente o que a modelagem propõe.

            Os dados podem ser tratados previamente em um editor de planilha, podendo economizar algumas etapas no Orange. Não temos conteúdos implementados especificamente no pré-processamento com o Orange. Mas, pesquisando encontrei mais alguns conteúdos que podem lhe ajudar:

            https://www.youtube.com/watch?v=UiedzQwqVXs

            https://orange3.readthedocs.io/projects/orange-data-mining-library/en/latest/reference/preprocess.html

            Fabio

             

          Visualizando 4 posts - 1 até 4 (de 4 do total)
          • Você deve fazer login para responder a este tópico.