O que você aprenderá
- Entenda a intuição básica sobre as GANs
- Gerar imagens de dígitos (0 – 9) utilizando DCGAN e WGAN
- Transformar imagens de satélites em mapas utilizando a arquitetura Pix2Pix
- Transformar zebras em cavalos utilizando a arquitetura CycleGAN
- Transferir estilos entre imagens
- Aplicar super resolução para melhorar a qualidade de imagens utilizando a arquitetura ESRGAN
- Criar novos rostos de pessoas com alta qualidade e definição utilizando ProGAN e StyleGAN
- Gerar imagens por meio de descrições textuais
- Restaurar fotos antigas utilizando GFP-GAN
- Completar partes faltantes de imagens utilizando a arquitetura Boundless
- Gerar deepfakes para trocar rostos com SimSwap
Pré-requisitos
- Lógica de programação
- Programação básica em Python
- Conhecimentos sobre redes neurais são desejáveis, porém não obrigatórios
Descrição
As GANs (Generative Adversarial Networks – Redes Adversárias Generativas) são consideradas uma das tecnologias mais modernas e fascinantes dentro da área de Deep Learning e Visão Computacional. Elas tem ganhado bastante destaque na mídia por terem a característica de gerarem conteúdo falso (fake). Um dos exemplos mais clássicos é a utilização de pessoas que não existem no mundo real para transmitirem telejornais e lerem as notícias, ou seja, a GAN consegue criar uma pessoa para falar com o telespectador. Essa tecnologia é considerada uma revolução na área de Inteligência Artificial por produzir resultados de alta qualidade, mantendo-se como um dos temas mais populares e relevantes.
Para levar você até essa área, neste curso você terá uma visão teórica básica e principalmente prática sobre as principais e mais modernas arquiteturas de GANs! Este curso é considerado um guia completo pelo fato de apresentar desde conceitos mais básicos até técnicas mais modernas e avançadas, de modo que ao final você terá todas as ferramentas necessárias para construir seus próprios projetos! Veja abaixo alguns dos projetos que serão implementados passo a passo:
- Geração dos dígitos de 0 até 9
- Transformação de imagens de satélite em imagens no formato de mapas, no estilo do Google Maps
- Transformação de desenhos (ou somente rabiscos) em fotos de alta qualidade
- Gerar zebras utilizando images de cavalos
- Transferir estilos entre imagens, utilizando pinturas de artistas famosos como Van Gogh, Cezanne e Ukiyo-e
- Aumentar a resolução de imagens com baixa qualidade (super resolução)
- Gerar deepfakes (faces falsas) com alta qualidade
- Gerar imagens de gatos e carros que não existem no mundo real
- Criar imagens por meio de descrições textuais
- Restaurar fotos antigas
- Completar partes faltantes de imagens
- Trocar o rosto de pessoas que estão em ambientes diferentes
Para implementar esses projetos, você aprenderá várias arquiteturas diferentes de GANs, como por exemplo: DCGAN (Deep Convolutional Generative Adversarial Network), WGAN (Wassertein GAN), WGAN-GP (Wassertein GAN-Gradient Penalty), cGAN (conditional GAN), Pix2Pix (Image-to-Image), CycleGAN (Cycle-Consistent Adversarial Network), SRGAN (Super Resolution GAN), ESRGAN (Enhanced Super Resolution GAN), ProGAN (Progressively Growing GAN), StyleGAN (Style-Based Generator Architecture for GANs), StackGAN (Stacked GANs), AttnGAN (Fine-Grained Text to Image Generation with Attentional GANs), BigGAN, GFP-GAN (Generative Facial Prior GAN), GAN ilimitada (Boundless) e SimSwap (Simple Swap).
Durante o curso, vamos utilizar a linguagem de programação Python e o Google Colab on-line, ou seja, você não precisa se preocupar com instalações e configurações de bibliotecas na sua própria máquina! São mais de 110 aulas e 16 horas de vídeos!
Para quem é este curso
- Pessoas interessadas em criar aplicações complexas utilizando GANs
- Alunos de graduação e pós-graduação que estão cursando disciplinas sobre Visão Computacional, Inteligência Artificial, Processamento Digital de Imagens ou Computação Gráfica
- Pessoas que querem implementar seus próprios projetos utilizando técnicas de Visão Computacional
- Cientistas de Dados que queiram aumentar o seu portfólio de projetos
Publicado em novembro de 2023
Até o momento o curso atende as minhas expectativas. O instrutor explica passo a passo os algoritmos de rede neural e seus parâmetros.