Seu Estado
Não Matriculado
Preço
Assinantes

O que você aprenderá

  • Os principais conceitos e cálculos estatísticos utilizados em Ciência de Dados e Machine Learning
  • Os cálculos de estatística e probabilidade implementados passo a passo na linguagem Python
  • Como a Estatística está relacionada com a Ciência de Dados e Machine Learning
  • Implementar técnicas de amostragem, como por exemplo: amostragem simples, sistemática, estratificada, grupos e reservatório
  • Aprender a teoria e a prática sobre os principais algoritmos de Machine Learning, bem como sua ligação com a Estatística
  • Utilizar técnicas de amostragem para lidar com dados desbalanceados em Machine Learning
  • Calcular percentuais, índices, coeficientes e taxas
  • Aprender passo a passo como calcular distribuições de frequência e gerar histogramas para visualização
  • Calcular medidas de posição, como por exemplo: média, moda, mediana, quartis e percentis
  • Calcular medidas de dispersão de dados, como por exemplo: amplitude, variância, desvio padrão e coeficiente de variação
  • Como utilizar as medidas de posição e dispersão para avaliar algoritmos de Machine Learning
  • Como utilizar medidas de posição para tratar valores faltantes em bases de dados
  • Calcular a variância para escolher os melhores atributos em uma base de dados
  • Entender a principais distribuições estatísticas e de probabilidade, como por exemplo: distribuição normal, gama, exponencial, uniforme, Bernoulli, binomial e de Poisson
  • Como utilizar a estatística inferencial para cálculos de probabilidade
  • Calcular intervalos de confiança
  • Realizar testes de hipóteses, implementando os cálculos passo a passo
  • Realizar testes de hipóteses com ANOVA, Qui Quadrado, Wilcoxon, Friedman e Nemenyi
  • Calcular correlação entre variáveis
  • Criar modelos de regressão linear para previsão de números
  • Criar gráficos e mapas para facilitar a interpretação dos dados

Requisitos

  • É desejável que você conheça o básico sobre a linguagem Python, porém, é possível acompanhar o curso tranquilamente sem conhecer essa linguagem com profundidade
  • É mais fácil para acompanhar o curso caso você já tenha um conhecimento inicial sobre Machine Learning. Contudo, existem aulas básicas sobre os algoritmos de Machine Learning antes de cada conteúdo específico

Descrição

A Estatística proporciona os meios e as ferramentas para encontrar estrutura em dados com o objetivo de fornecer insights sobre as informações mais profundas ali escondidas. Medidas estatísticas como média, mediana, moda, desvio padrão e distribuição servem para descrever o comportamento das variáveis de uma base de dados, assim como identificar anomalias. Em outras palavras, é preciso conhecer a “matéria-prima” com que se está trabalhando por meio de características que nos servem de resumo sobre sua natureza. Esse é o objetivo da Estatística! Se os algoritmos de machine learning são as ferramentas que os cientistas de dados operam, a Estatística é o conhecimento sobre como e porquê essas ferramentas funcionam, permitindo escolher as ferramentas mais adequadas para tirar o melhor proveito delas.

Existe um ditado atribuído a Josh Wills, ex-funcionário do Google e do Cloudera e atualmente presidente de Engenharia de Dados do Slack: um cientista de dados é um programador melhor do que qualquer estatístico e um estatístico melhor do que qualquer programador. Sem um bom conhecimento estatístico, o cientista de dados é como um soldado cego com um arsenal poderoso. O domínio estatístico torna seu trabalho mais direcionado, eficiente e robusto, e permite uma utilização mais ativa dos modelos de machine learning já estabelecidos, uma vez que ele tem o conhecimento necessário para investigar as bases teóricas que fundamentam esses modelos.

Baseado nisso, neste curso você terá uma visão teórica e principalmente prática passo a passo sobre os principais conceitos de Estatística, bem como sua ligação com a Ciência de Dados e a Aprendizagem de Máquina (Machine Learning). Você aprenderá a teoria, os cálculos passo a passo, implementará os cálculos utilizando a linguagem de programação Python e também utilizará bibliotecas prontas! O diferencial deste curso é que além de aprender estatística, você aprenderá como utilizá-la em aprendizagem de máquina. O conteúdo está dividido em nove partes: (i) população e amostra, (ii) dados relativos e absolutos, (iii) distribuição de frequência, (iv) medidas de posição e dispersão, (v) distribuições estatísticas, (vi) probabilidade, (vii) intervalos de confiança e testes de hipóteses, (viii) correlação e regressão e (ix) visualização. Confira abaixo alguns dos tópicos que você aprenderá, integrando os conceitos estatísticos com aprendizagem de máquina e ciência de dados:

  • Uso de amostragem para trabalhar com dados desbalanceados em classificação ou regressão (undersampling e oversampling)
  • Cálculos de distribuição de frequência para aplicação de regras de associação
  • Avaliação de algoritmos de classificação utilizando medidas de posição e dispersão
  • Seleção de atributos utilizando cálculos de variância
  • Preenchimento de valores faltantes em bases de dados utilizando medidas de posição
  • Cálculo de padronização (z-score) aplicado em machine learning
  • Tratamento de dados enviesados em machine learning
  • Uso de distribuições estatísticas para inicialização de pesos em redes neurais artificiais
  • Algoritmo Naïve Bayes utilizando as distribuições de Bernoulli e Multinomial
  • Previsões com probabilidade em machine learning
  • Uso das técnicas ANOVA e Qui Quadrado para seleção de atributos em bases de dados
  • Testes de hipóteses paramétricos e não paramétricos, aplicados na avaliação de algoritmos
  • Previsão do preço de casas utilizando regressão linear
  • Criação de gráficos e mapas para ajudar na interpretação de dados

Este é o curso ideal caso você queira aumentar significativamente seus conhecimentos em Estatística, Ciência de Dados e Machine Learning, mais de 160 aulas com exercícios resolvidos! O curso é para todos os níveis de conhecimento, ou seja, se você é iniciante ou de nível avançado conseguirá aproveitar o conteúdo.

Para quem é este curso

  • Pessoas que queiram entender a relação entre a Estatística, Ciência de Dados e Machine Learning
  • Pessoas que querem estudar Estatística para Ciência de Dados e Machine Learning, porém, não sabem por onde começar
  • Alunos de graduação que estão estudando disciplinas ligadas a área de Inteligência Artificial
  • Qualquer pessoa interessada em Estatística, Ciência de Dados e Machine Learning
  • Cientistas de Dados que queiram aumentar seus conhecimentos em Estatística

Publicado em setembro de 2020

Conteúdo do Curso

Expandir
Conteúdo da Lição
0% Completo 0/1 Passos

Avaliações e Comentários

4.9
Avaliação média
165 Avaliações
5
152
4
11
3
2
2
0
1
0
Qual foi a sua experiência com esse curso? Conte para nós!
Comentário extraído do curso na Udemy
Publicado 4 semanas atrás
por Edney Luis Oliveira Fernandes

Estou gostando do curso.

×
Preview Image
Comentário extraído do curso na Udemy
Publicado 1 mês atrás
por Samuel da Silva Tavares

Até o momento o curso realmente entrega um passo a passo para solidificar uma base para quem não sabe e nada e depois disso ir escalando o nivel de dificuldade com muita paciencia. Muito bom!!

×
Preview Image
Comentário extraído do curso na Udemy
Publicado 2 meses atrás
por Ederson Santos Silva

ótima didática

×
Preview Image
Delfina Renata Lima
Publicado 2 meses atrás
Um curso de qualidade sobre estatistica!!!

Um curso directo, muito completo e organizado.

×
Preview Image
Comentário extraído do curso na Udemy
Publicado 2 meses atrás
por Rafael Henrique Simões Gomes

Curso sensacional! O Jonas realmente é muito bom no assunto e também um ótimo professor. Algumas observações: o curso ensina tudo sobre estatística aplicada com a linguagem Python. Algumas bibliotecas são atualizadas constantemente por isso o código às vezes não funciona, mas é só tirar um print da tela e fazer uma pergunta no comentário do vídeo que logo a equipe o conserta. Algumas outras vezes o aluno precisa rever o que digitou porque pode haver erros de digitação em seu código. Senti falta de mais conteúdos em texto. O curso tem um slide muito bom, porém o professor só narra o código e todas as suas execuções conforme ele vai fazendo. Porém, eu queria ver mais textos nos notebooks do Google Colab porque só consigo fixar o conteúdo seu eu puder ler depois. Se eu só assistir, logo esqueço. Então já fica uma recomendação: coloquem mais textos e comentários nos códigos ou então criem PDFs para que o aluno faça download e possa revisar os conteúdos depois. Não liguem para a fala devagar do professor. Tem muitos detalhes importantes que não pode ser explicados rapidamente senão você não vai aprender. Às vezes a aula se torna cansativa por causa disso, mas entenda que é necessário. No mais, o curso é excelente; podem comprar sem medo!

×
Preview Image
Comentário extraído do curso na Udemy
Publicado 3 meses atrás
por JOSE PORTO

Fantástico !!!

×
Preview Image
Comentário extraído do curso na Udemy
Publicado 4 meses atrás
por Rafael Piazenski

Claro e obejtivo!

×
Preview Image
Comentário extraído do curso na Udemy
Publicado 4 meses atrás
por Paulo Ponte

lindo

×
Preview Image
Comentário extraído do curso na Udemy
Publicado 4 meses atrás
por Adson Nogueira Alves

Excelente didática e bem fundamentado

×
Preview Image
Comentário extraído do curso na Udemy
Publicado 5 meses atrás
por Rodrigo Rodrigues de Oliveira

Coincidiu com o Concurso da CEF. Surpreendido positivamente até o momento!

×
Preview Image
Mostrar mais avaliações
Qual foi a sua experiência com esse curso? Conte para nós!