Estatística para Ciência de Dados e Machine Learning

Assinatura IA Expert

Além deste curso tenha acesso a +90 outros com atualizações contínuas.

Ver Planos de Assinatura
OU

Comprar Acesso Vitalício

Pague uma única vez e tenha acesso a este curso e todos os seus materiais para sempre.

Comprar por R$ 49,00

Já possui acesso?

Faça login para continuar de onde parou e acessar seu conteúdo.

Seu Estado

Não Inscrito

Preço

Grátis

Comece Agora

O que você aprenderá

  • Os principais conceitos e cálculos estatísticos utilizados em Ciência de Dados e Machine Learning
  • Os cálculos de estatística e probabilidade implementados passo a passo na linguagem Python
  • Como a Estatística está relacionada com a Ciência de Dados e Machine Learning
  • Implementar técnicas de amostragem, como por exemplo: amostragem simples, sistemática, estratificada, grupos e reservatório
  • Aprender a teoria e a prática sobre os principais algoritmos de Machine Learning, bem como sua ligação com a Estatística
  • Utilizar técnicas de amostragem para lidar com dados desbalanceados em Machine Learning
  • Calcular percentuais, índices, coeficientes e taxas
  • Aprender passo a passo como calcular distribuições de frequência e gerar histogramas para visualização
  • Calcular medidas de posição, como por exemplo: média, moda, mediana, quartis e percentis
  • Calcular medidas de dispersão de dados, como por exemplo: amplitude, variância, desvio padrão e coeficiente de variação
  • Como utilizar as medidas de posição e dispersão para avaliar algoritmos de Machine Learning
  • Como utilizar medidas de posição para tratar valores faltantes em bases de dados
  • Calcular a variância para escolher os melhores atributos em uma base de dados
  • Entender a principais distribuições estatísticas e de probabilidade, como por exemplo: distribuição normal, gama, exponencial, uniforme, Bernoulli, binomial e de Poisson
  • Como utilizar a estatística inferencial para cálculos de probabilidade
  • Calcular intervalos de confiança
  • Realizar testes de hipóteses, implementando os cálculos passo a passo
  • Realizar testes de hipóteses com ANOVA, Qui Quadrado, Wilcoxon, Friedman e Nemenyi
  • Calcular correlação entre variáveis
  • Criar modelos de regressão linear para previsão de números
  • Criar gráficos e mapas para facilitar a interpretação dos dados

Requisitos

  • É desejável que você conheça o básico sobre a linguagem Python, porém, é possível acompanhar o curso tranquilamente sem conhecer essa linguagem com profundidade
  • É mais fácil para acompanhar o curso caso você já tenha um conhecimento inicial sobre Machine Learning. Contudo, existem aulas básicas sobre os algoritmos de Machine Learning antes de cada conteúdo específico

Descrição

A Estatística proporciona os meios e as ferramentas para encontrar estrutura em dados com o objetivo de fornecer insights sobre as informações mais profundas ali escondidas. Medidas estatísticas como média, mediana, moda, desvio padrão e distribuição servem para descrever o comportamento das variáveis de uma base de dados, assim como identificar anomalias. Em outras palavras, é preciso conhecer a “matéria-prima” com que se está trabalhando por meio de características que nos servem de resumo sobre sua natureza. Esse é o objetivo da Estatística! Se os algoritmos de machine learning são as ferramentas que os cientistas de dados operam, a Estatística é o conhecimento sobre como e porquê essas ferramentas funcionam, permitindo escolher as ferramentas mais adequadas para tirar o melhor proveito delas.

Existe um ditado atribuído a Josh Wills, ex-funcionário do Google e do Cloudera e atualmente presidente de Engenharia de Dados do Slack: um cientista de dados é um programador melhor do que qualquer estatístico e um estatístico melhor do que qualquer programador. Sem um bom conhecimento estatístico, o cientista de dados é como um soldado cego com um arsenal poderoso. O domínio estatístico torna seu trabalho mais direcionado, eficiente e robusto, e permite uma utilização mais ativa dos modelos de machine learning já estabelecidos, uma vez que ele tem o conhecimento necessário para investigar as bases teóricas que fundamentam esses modelos.

Baseado nisso, neste curso você terá uma visão teórica e principalmente prática passo a passo sobre os principais conceitos de Estatística, bem como sua ligação com a Ciência de Dados e a Aprendizagem de Máquina (Machine Learning). Você aprenderá a teoria, os cálculos passo a passo, implementará os cálculos utilizando a linguagem de programação Python e também utilizará bibliotecas prontas! O diferencial deste curso é que além de aprender estatística, você aprenderá como utilizá-la em aprendizagem de máquina. O conteúdo está dividido em nove partes: (i) população e amostra, (ii) dados relativos e absolutos, (iii) distribuição de frequência, (iv) medidas de posição e dispersão, (v) distribuições estatísticas, (vi) probabilidade, (vii) intervalos de confiança e testes de hipóteses, (viii) correlação e regressão e (ix) visualização. Confira abaixo alguns dos tópicos que você aprenderá, integrando os conceitos estatísticos com aprendizagem de máquina e ciência de dados:

  • Uso de amostragem para trabalhar com dados desbalanceados em classificação ou regressão (undersampling e oversampling)
  • Cálculos de distribuição de frequência para aplicação de regras de associação
  • Avaliação de algoritmos de classificação utilizando medidas de posição e dispersão
  • Seleção de atributos utilizando cálculos de variância
  • Preenchimento de valores faltantes em bases de dados utilizando medidas de posição
  • Cálculo de padronização (z-score) aplicado em machine learning
  • Tratamento de dados enviesados em machine learning
  • Uso de distribuições estatísticas para inicialização de pesos em redes neurais artificiais
  • Algoritmo Naïve Bayes utilizando as distribuições de Bernoulli e Multinomial
  • Previsões com probabilidade em machine learning
  • Uso das técnicas ANOVA e Qui Quadrado para seleção de atributos em bases de dados
  • Testes de hipóteses paramétricos e não paramétricos, aplicados na avaliação de algoritmos
  • Previsão do preço de casas utilizando regressão linear
  • Criação de gráficos e mapas para ajudar na interpretação de dados

Este é o curso ideal caso você queira aumentar significativamente seus conhecimentos em Estatística, Ciência de Dados e Machine Learning, mais de 160 aulas com exercícios resolvidos! O curso é para todos os níveis de conhecimento, ou seja, se você é iniciante ou de nível avançado conseguirá aproveitar o conteúdo.

Para quem é este curso

  • Pessoas que queiram entender a relação entre a Estatística, Ciência de Dados e Machine Learning
  • Pessoas que querem estudar Estatística para Ciência de Dados e Machine Learning, porém, não sabem por onde começar
  • Alunos de graduação que estão estudando disciplinas ligadas a área de Inteligência Artificial
  • Qualquer pessoa interessada em Estatística, Ciência de Dados e Machine Learning
  • Cientistas de Dados que queiram aumentar seus conhecimentos em Estatística

Publicado em setembro de 2020

Conteúdo do Curso

Introdução 3 Tópicos
Considerações finais 1 Tópico
Conteúdo do Lição
0% Concluído 0/1 Passos

Avaliações e Comentários

4.9
Avaliação média
188 Avaliações
5
174
4
12
3
2
2
0
1
0
Qual foi a sua experiência com esse curso? Conte para nós!
Comentário extraído do curso na Udemy
Publicado 1 mês atrás
por Davi Duarte Cucco

Superou minhas expectativas. Demonstra como cada uns dos conceitos da estatística, do mais simples até os mais avançados, são aplicados dentro da área de Aprendizagem de Máquina. Tudo isso de forma clara, objetiva e dinâmica.

×
Preview Image
Silvio Nunes dos Santos
Publicado 2 meses atrás
Aprendizado leve e eficiente

Não posso falar porque sou suspeito. Só tenho elogios a didática do professor Jones.

×
Preview Image
Comentário extraído do curso na Udemy
Publicado 3 meses atrás
por Bruno Gama

O curso é muito detalhado e muito bem estruturados em seus temas. As explicações são muito claras, com um ritmo bom de voz.

×
Preview Image
Comentário extraído do curso na Udemy
Publicado 4 meses atrás
por Tiago Pereira de Nonohay

excelente densidade de conteúdo.

×
Preview Image
Comentário extraído do curso na Udemy
Publicado 5 meses atrás
por Hallan Patrick de Oliveira Roça

Excelente curso Jones, muito obrigado pela sua dedicação em fazer um curso de qualidade.

×
Preview Image
Comentário extraído do curso na Udemy
Publicado 5 meses atrás
por Pedro Nkadilu D. Barros

Estou no começo da formação, mas já achei bem interessante.

×
Preview Image
Francisco Elvis Dos Santos
Publicado 7 meses atrás
Seguindo a Trilha Machine Learning

Seguindo firme na Trilha de Machine Learning! Cada passo é um mergulho mais profundo nesse universo fascinante de dados, algoritmos e descobertas. Aprendizado constante, desafios instigantes e aquela sensação boa de estar construindo algo grande.

×
Preview Image
Comentário extraído do curso na Udemy
Publicado 7 meses atrás
por Gabriel Joffily Escudine

Um ótimo curso para aqueles que começam na área de dados, principalmente quando trabalha-se muito com a análise de grandes conjuntos de dados. Com esse curso, obtive um ótimo conhecimento e em muitos casos consegui aplicar o que é ensinado aqui no meu trabalho, fora a sensação de conseguir acompanhar as discussões técnicas do time. Esse curso dá uma ótima base para que você saia dele e faça algum projeto como, por exemplo, o Titanic, do Kaggle, para praticar o que é ensinado neste curso. Recomendo bastante como um curso para ter o conhecimento inicial sobre essas técnicas que são muito utilizadas no dia a dia. Comprei este curso com o intuito de adquirir uma base prática em estatística e sinto que consegui o que queria. Agora é praticar o que foi ensinado neste curso e se aprofundar em mais conceitos.

×
Preview Image
Comentário extraído do curso na Udemy
Publicado 7 meses atrás
por Leonardo Vinícius de Santana

Excelente curso, ótimo para iniciar na carreira de dados

×
Preview Image
Comentário extraído do curso na Udemy
Publicado 8 meses atrás
por Dario César Neves

Professor Jones, boa tarde. Comprei a pouco (em 08/08/2025) o curso (Estatística para Ciência de Dados e Machine Learning) dentro da oferta/promoção/cupon (IAAGO25 – compre 1 curso e ganhe 3 cursos) encaminhada para meu e-mail. Os outros 3 cursos escolhidos para liberação são: 1 - ChatGPT para Ciência de Dados e Machine Learning 2 - Álgebra Linear para Data Science e Machine Learning 3 - Python para Finanças: Análise de Dados e Machine Learning. Aguardo liberação destes cursos. Caso não seja esse o local para essa solicitação, gentileza enviar-me o local/link exato para essa solicitação. No aguardo, muito obrigado. Abraço!!! Resposta: Jones Granatyr (Instrutor) Olá, Dario! A solicitação dos cursos deve ser feita via mensagem na Udemy ATENÇÂO: Caro Professor, No mesmo dia 08/08/2025, mandei essa solicitação para liberação dos cursos acima, ou pedindo o exato caminho/orientação/link onde faço essa solicitação, caso não seja por aqui,  Não localizei o local da sua resposta (via mensagem na Udemy), por favor onde fica isso? Por favor, me passe o caminlho ou link (não achei o local para enviar mensagem na plataforma Udemy)??? Grato pela compreensão !!

×
Preview Image
Mostrar mais avaliações
Qual foi a sua experiência com esse curso? Conte para nós!