Machine Learning para Competições Kaggle – Curso 1

Aprenda passo a passo como trabalhar com bases de dados de classificação e regressão voltados a desafios reais no Python! Faça a previsão do comportamento de consumidores de uma empresa de telecomunicações e previsão de tarifas de táxi de Nova Iorque (7h)
Última atualização: 2 de setembro de 2020
Seu Estado
Não Inscrito
Preço
Assinantes

O que você aprenderá

  • Como trabalhar com bases de dados reais de classificação e regressão, aplicado em competições reais (KDD e Kaggle)
  • Desenvolva insights que permitam construir modelos de Machine Learning aplicados em problemas reais
  • Aprenda exploração de dados, feature engineering, treinamento e fine-tuning de modelos voltados para desafios reais
  • Crie vários tipos de gráficos para ajudar na compreensão e análise dos dados
  • Faça a previsão de cancelamento de conta, tendência de usar novos produtos e propensão para comprar upgrades; aplicado em uma base real de empresa de telecomunicações
  • Faça a previsão da tarifa de preços de corridas de táxi da cidade de Nova Iorque

Requisitos

  • Familiaridade com os conceitos básicos e algoritmos de Machine Learning
  • Lógica de programação, principalmente estruturas condicionais e de repetição
  • Programação básica em Python

Descrição

As competições de Ciência de Dados como aquelas postadas na plataforma Kaggle são uma ótima maneira de testar as habilidades adquiridas em cursos iniciais, e ainda aprender novas habilidades necessárias para resolver problemas reais. Entretanto, fazer essa transição entre um ambiente educacional e aquele que encontramos no Kaggle, que imita os desafios que devemos encontrar no mercado de trabalho, tende a ser um degrau muito grande, pois a natureza dos dados e dos problemas propostos aumenta de complexidade num nível que os cursos básicos não contemplam. 

Pensando nisso, este curso tem o objetivo de preencher essa lacuna na formação dos cientistas de dados, mostrando detalhadamente como abordar os desafios, passando pelas fases de exploração e tratamento de dados, escolha de abordagem de solução, construção de um modelo, treinamento e validação; até a entrega de um resultado inicial em formato que pode ser submetido às competições. O entendimento desse processo é o primeiro passo para que os competidores possam desenvolver melhorias e começar sua escalada rumo ao topo dos rankings.

Neste curso focaremos em duas das principais tarefas da aprendizagem de máquina: classificação e regressão.

  1. Com relação a classificação, vamos trabalhar com uma base de dados real de uma empresa de telecomunicações do KDD Cup 2009, na qual o objetivo é modelar o comportamento do consumidor analisando três características: cancelamento da conta, tendência de usar novos produtos e serviços e a propensão para comprar upgrades ou adicionais com maior margem de lucro
  2. No que se refere a regressão, vamos trabalhar com uma base de dados real das corridas de táxi no Nova Iorque do Kaggle 2018! O objetivo é prever o valor da tarifa para uma corrida de táxi nesta cidade

Vamos desenvolver todos os códigos utilizando a linguagem Python e linha por linha, de forma que você entenda todas as análises necessárias para participar dessas competições!

Para quem é este curso

  • Pessoas que já estejam num nível intermediário de sua formação em Ciência de Dados, e que agora estejam procurando aprender a usar suas habilidades em desafios reais
  • Analistas de dados que queiram aumentar seu conhecimento na área de Machine Learning
  • Alunos de graduação que estão estudando disciplinas ligadas a área de Inteligência Artificial
  • Qualquer pessoa interessada em Inteligência Artificial