Seu Estado
Não Matriculado
Preço
Assinantes

O que você aprenderá

  • Como trabalhar com bases de dados específicas para competições Kaggle
  • Como resolver problemas de recuperação de informação, regressão e diagnóstico por imagens para ajudar a comunidade científica na pandemia de COVID-19
  • Desenvolva insights que permitam construir modelos de Machine Learning aplicados em problemas reais
  • Aprenda exploração de dados voltados para desafios reais
  • Crie vários tipos de gráficos para ajudar na compreensão e análise dos dados
  • Utilize técnicas modernas para recuperação de informações em documentos de texto
  • Utilize regressão para prever o número de mortes por COVID-19
  • Utilize técnicas modernas de deep learning; como redes neurais convolucionais e transfer learning, para diagnosticar pacientes com COVID-19 utilizando imagens de Raio X

Requisitos

  • Familiaridade com os conceitos básicos e algoritmos de Machine Learning
  • Lógica de programação, principalmente estruturas condicionais e de repetição
  • Programação básica em Python

Descrição

De acordo com o CDC (Centers for Disease Control and Prevention), o novo coronavírus de 2019 é um vírus identificado como a causa de um surto de doença respiratória detectado pela primeira vez em Wuhan, na China. Desde o início, muitos dos pacientes do surto em Wuhan teriam algum vínculo com um grande mercado de frutos do mar e animais silvestres. Um número crescente de pacientes supostamente não teve exposição ao mercado de animais, indicando a ocorrência de disseminação de pessoa para pessoa. O vírus já se espalhou para praticamente todos os países do mundo, causando muitas mortes e sérios problemas na economia. Devido a isso, a Casa Branca dos Estados Unidos junto com pesquisadores e líderes do Allen Institute for AI, Chan Zuckerberg Initiative (CZI), Georgetown University’s Center for Security and Emerging Technology (CSET), Microsoft, e o National Library of Medicine (NLM) at the National Institutes of Health lançaram uma base de dados com artigos publicados sobre o COVI-19, SARS-CoV-2 e vírus do grupo dos coronavírus.

A base de dados possui mais de 30.000 artigos científicos sobre essas doenças, sendo que o objetivo principal é ajudar pesquisadores e profissionais da saúde obterem informações relevantes sobre esses assuntos. Leia alguns trechos do chamado (call to action) da Casa Branca: “A Casa Branca se une a essas instituições ao emitir um apelo à ação dos especialistas em inteligência artificial da nação para desenvolver novas técnicas de mineração de texto e dados que podem ajudar a comunidade científica a responder perguntas científicas de alta prioridade relacionadas ao COVID-19“, “Precisamos nos unir como empresas, governos e cientistas e trabalhar para trazer nossas melhores tecnologias para a biomedicina, epidemiologia, IA e outras ciências. O recurso e desafio da literatura COVID-19 estimulará esforços que podem acelerar o caminho para soluções em COVID-19“, “Uma das aplicações mais imediatas e impactantes da IA é a capacidade de ajudar cientistas, acadêmicos e tecnólogos a encontrar as informações corretas em um mar de artigos científicos para impulsionar a pesquisa mais rapidamente“, “É difícil para as pessoas revisarem manualmente mais de 20.000 artigos e sintetizarem suas descobertas. Avanços recentes em tecnologia podem ser úteis aqui“.

Como essa base de dados foi postada como um desafio no Kaggle, é uma ótima oportunidade para testar as habilidades adquiridas em cursos iniciais, e ainda aprender novas habilidades necessárias para resolver problemas reais. Entretanto, fazer essa transição entre um ambiente educacional e aquele que encontramos no Kaggle, que imita os desafios que devemos encontrar no mercado de trabalho, tende a ser um degrau muito grande, pois a natureza dos dados e dos problemas propostos aumenta de complexidade num nível que os cursos básicos não contemplam. Pensando nisso, este curso tem o objetivo de preencher essa lacuna na formação dos cientistas de dados, mostrando detalhadamente como abordar os desafios, passando pelas fases de exploração e tratamento de dados, escolha de abordagem de solução, construção de um modelo, treinamento e validação. O entendimento desse processo é o primeiro passo para que os competidores possam desenvolver melhorias e começar sua escalada rumo ao topo dos rankings.

Além da base de dados descrita acima, neste curso também focaremos em mais duas bases de dados relacionadas ao COVID-19. Com isso, o curso está dividido em três partes:

  1. Recuperação de informações de bases de dados de artigos: vamos usar a base de dados dos artigos científicos e aplicar várias técnicas de mineração de textos e processamento de linguagem natural, utilizando bibliotecas como NLTK (Natural Language Toolkit, spaCy, WordCloud e fuzzywuzzy. Focaremos na etapa de preparação e visualização dos textos, como por exemplo: contagem de termos frequentes, nuvem de palavras e aplicação de algoritmos para agrupamento, como o k-means! Implementaremos também sistemas de busca em textos que levam em consideração palavras-chave e similaridade entre documentos utilizando TF-IDF (Term Frequency – Inverse Documento Frequency)
  2. Previsões de mortes por COVID-19: utilizaremos outra base de dados do Kaggle para prever as mortes diárias, utilizando algoritmos de regressão
  3. Diagnóstico de pacientes com COVID-19 por meio do Raio-X do tórax: vamos utilizar modernas técnicas de Deep Learning com o TensorFlow 2.0, ou seja, redes neurais convolucionais e transferência de aprendizagem (transfer learning) para classificar imagens de pacientes doentes e saudáveis!

Os códigos serão desenvolvidos utilizando a linguagem Python linha por linha e com o Google Colab, de forma que você entenda todas as análises necessárias para participar dessas competições!

Para quem é este curso

  • Pessoas que já estejam num nível intermediário de sua formação em Ciência de Dados, e que agora estejam procurando aprender a usar suas habilidades em desafios reais
  • Analistas de dados que queiram aumentar seu conhecimento na área de Machine Learning
  • Alunos de graduação que estão estudando disciplinas ligadas a área de Inteligência Artificial
  • Qualquer pessoa interessada em Inteligência Artificial

Conteúdo do Curso

Expandir
Parte 1 - Recuperação de documentos
Parte 2 - Previsões de mortes por COVID-19
Parte 3: Diagnóstico de COVID-19 com imagens de Raio-X

Avaliações e Comentários

4.8
Avaliação média
24 Avaliações
5
20
4
4
3
0
2
0
1
0
Qual foi a sua experiência com esse curso? Conte para nós!
Comentário extraído do curso na Udemy
Publicado 2 meses atrás
por Elson Pessoa Vasques

Muito boa a explicação.

×
Preview Image
Comentário extraído do curso na Udemy
Publicado 7 meses atrás
por Celso Lima de Souza

Como sempre os melhores cursos em programação com python.

×
Preview Image
Comentário extraído do curso na Udemy
Publicado 2 anos atrás
por André Felipe Guimarães

Consegui aprender bastante sobre processamento de linguagem natural. É uma ótima introdução.

×
Preview Image
Comentário extraído do curso na Udemy
Publicado 3 anos atrás
por Carlos Eduardo da Silva

sensacional. Parabéns pelo curso e pela as técnicas ensinadas.

×
Preview Image
Comentário extraído do curso na Udemy
Publicado 3 anos atrás
por Marcelo Barbosa de Oliveira

Estou aprendo muito. Curso até momento muito bom.

×
Preview Image
Comentário extraído do curso na Udemy
Publicado 4 anos atrás
por Luciano Galdino

Curso ótimo, atendeu minhas expectativas.

×
Preview Image
Comentário extraído do curso na Udemy
Publicado 4 anos atrás
por Jose Evertonildo Bessa Maia

Queria conhecer novas funcionalidades do python aplicado a DC, o curso está sendo bastante proveitoso.

×
Preview Image
Comentário extraído do curso na Udemy
Publicado 4 anos atrás
por Katharine Góes Carvalho Pires

INCRÍVEL! Não tenho outra palavra que possa definir esse curso. Muito bom, várias dicas... Gostei bastante

×
Preview Image
Comentário extraído do curso na Udemy
Publicado 4 anos atrás
por Liz Evelyn de Medeiros Felix

Me surpreendeu! Curso muito TOP e um ótimo professor. Estou amando os materiais.

×
Preview Image
Comentário extraído do curso na Udemy
Publicado 4 anos atrás
por Renato Seiji Eishima

Como em todos os cursos do Jones Granatyr esse curso é muito bem detalhado e explicado o que se está fazendo em cada aula e cada células dos códigos! O curso vale muito a pena! Apenas uma sugestão (não é pra falar mal do curso, mas pra melhorá-lo ainda mais) é que poderia fazer uma aula a mais utilizando os dados da secretaria de saúde pra fazer um especificamente sobre os casos no Brasil. Mas é só uma sugestão pois o curso é muito bom!!

×
Preview Image
Mostrar mais avaliações
Qual foi a sua experiência com esse curso? Conte para nós!