Seu Estado
Não Matriculado
Preço
Assinantes

O que você aprenderá

    Pré-requisitos

    • Lógica de programação
    • Programação básica em Python
    • Conhecimentos sobre Machine Learning são desejáveis mas não obrigatórios

    Descrição

    A área de Processamento de Linguagem Natural – PLN (Natural Language Processing – NLP) é uma subárea da Inteligência Artificial que tem como objetivo tornar os computadores capazes de entender a linguagem humana, tanto escrita quanto falada. Alguns exemplo de aplicações práticas são: tradutores entre idiomas, tradução de texto para fala ou fala para texto, chatbots, sistemas automáticos de perguntas e respostas, sumarização de textos, geração automática de descrições para imagens, adição de legendas em vídeos, classificação de sentimentos em frases e áudios, dentre várias outras! Dentro desta área existe a classificação de áudio, que consiste em identificar sons específicos em áudios. Alguns exemplos são: identificação de sons do ambiente (carros, buzina, latidos, sirenes, etc), classificação de estilos musicais, transcrição de texto, reconhecimento de emoções pela fala e reconhecimento de comandos de voz, muito utilizado pelos assistentes virtuais.

    Atualmente, o setor comercial está cada vez mais necessitando de soluções de Processamento de Linguagem Natural voltadas ao áudio, ou seja, aprender essa área pode ser a chave para trazer soluções reais para necessidades presentes e futuras. Baseado nisso, este curso foi projetado para quem deseja crescer ou iniciar uma nova carreira na área de Processamento de Linguagem Natural, trabalhando especificamente com a classificação de arquivos de áudio! O curso está dividido em sete partes:

    • Na parte 1 você aprenderá os conceitos teóricos sobre a área de áudio, como por exemplo: o que são sinais de áudio, sinal analógico e digital, amplitude, ondas, frequência, decibel, taxa de amostragem e principalmente, como representar o áudio para ser enviado para algoritmos de aprendizagem de máquina
    • Na parte 2 serão implementados na prática vários dos conceitos abordados na primeira parte! Alguns exemplos são: carregamento e execução de arquivos de áudio, separação harmônica-percursiva, sintetização de cliques, Transformada de Fourier, Coeficiente Cepstral de Frequência Mel e geração de gráfico de ondas e espectrogramas. Ao final deste módulo, você saberá como extrair dados dos áudios para envio para algoritmos de aprendizagem de máquina. Será utilizada a biblioteca Librosa
    • Na parte 3, vamos utilizar a base UrbanSound8K para classificar os seguintes sons ambientais: ar condicionado, buzina de carro, crianças brincando, latidos de cachorro, perfuração, motor em marcha lenta, tiros de arma, britadeira, sirene e música de rua. Faremos o treinamento de uma rede neural convolucional utilizando o TensorFlow, e ao final, vamos enviar um áudio e a rede neural será capaz de classificar qualquer uma dessas categorias
    • Na parte 4, vamos utilizar a arquitetura pré-treinada YAMNet para classificar 521 diferentes eventos de áudio! Logo após, utilizaremos transferência de aprendizagem para classificar o canto de 5 espécies diferentes de pássaros
    • Na parte 5 utilizarmos a base de dados RAVDESS para classificar as seguintes emoções de áudios: tristeza, surpresa, nojo, neutro, medo, felicidade e calmo
    • Na parte 6 você entenderá o básico sobre como funciona um assistente de voz! Por meio da base mini-speech-commands, vamos treinar uma rede neural para classificar 8 tipos diferentes de comandos
    • Por fim, na parte 7 utilizaremos a biblioteca SpeechRecognition para realizar a transcrição de áudio, ou seja, você fala e o algoritmo faz a transcrição em formato textual!

    Todos os códigos serão implementados passo a passo, com detalhes e utilizando o Google Colab. Com isso, você não precisa se preocupar com instalações e configurações de softwares na sua própria máquina! São mais de 110 aulas e mais de 14 horas de vídeos passo a passo!

    Para quem é este curso

    • Pessoas interessadas em classificação de áudio e processamento de linguagem natural
    • Alunos de graduação e pós-graduação que estejam cursando disciplinas sobre Inteligência Artificial
    • Cientistas de Dados que tenham interesse em aumentar seu portfólio de projetos

    Última atualização em junho de 2022

    Conteúdo do Curso

    Expandir
    Conteúdo da Lição
    0% Completo 0/1 Passos

    Avaliações e Comentários

    4.8
    Avaliação média
    17 Avaliações
    5
    14
    4
    3
    3
    0
    2
    0
    1
    0
    Qual foi a sua experiência com esse curso? Conte para nós!
    Gabriel Palitot
    Publicado 4 meses atrás
    Curso completo

    Gostei muito da estrutura e do que foi apresentado, pude aprender bastante no curso.

    ×
    Preview Image
    Renilson
    Publicado 11 meses atrás
    curso otimo, explica tudo.

    gostei da didática.

    ×
    Preview Image
    Comentário extraído do curso na Udemy
    Publicado 11 meses atrás
    por Filipe Fontinele de Almeida

    Ótimo!

    ×
    Preview Image
    Comentário extraído do curso na Udemy
    Publicado 1 ano atrás
    por João Augusto Machado Coelho

    Excelente Professor, didático e atencioso. Os conteúdos são excelentes, atuais e muito importantes para o mundo tecnológico ao qual estamos inseridos.

    ×
    Preview Image
    IA Medicine
    Publicado 1 ano atrás
    otimo

    otimo

    ×
    Preview Image
    Comentário extraído do curso na Udemy
    Publicado 1 ano atrás
    por Ricardo duarte

    Ótimo curso, o Professor tem uma boa didática, este curso vai ajudar muito a entender os conceitos iniciais desta área!!!

    ×
    Preview Image
    Comentário extraído do curso na Udemy
    Publicado 1 ano atrás
    por Antônio Carlos Flach

    O curso apresenta diversas aplicações de classificação de áudio, onde se acompanha o professor através do Google Colab. Há muitos pontos não explicados durante o curso, principalmente onde se mostra o código sem esclarecer devidamente sua utilidade e/ou funcionamento. Deveria também haver um anexo extra tratando dos tópicos de numpy, Pandas etc que são bastante utilizados no curso.

    ×
    Preview Image
    Comentário extraído do curso na Udemy
    Publicado 1 ano atrás
    por Antônio Carlos Flach

    O curso apresenta diversas aplicações de classificação de áudio, onde se acompanha o professor através do Google Colab. Há muitos pontos não explicados durante o curso, principalmente onde se mostra o código sem esclarecer devidamente sua utilidade e/ou funcionamento. Deveria também haver um anexo extra tratando dos tópicos de numpy, Pandas etc que são bastante utilizados no curso.

    ×
    Preview Image
    Comentário extraído do curso na Udemy
    Publicado 1 ano atrás
    por Paulo Cesar de Oliveira Franco

    Muito bom

    ×
    Preview Image
    Comentário extraído do curso na Udemy
    Publicado 2 anos atrás
    por Hariel Soares Maran

    Muito bom o curso, pra eu que sou leigo no assunto, estou achando ótimo! professor fala de um jeito que conseguimos entender o assunto proposto, e superou as minhas expectativas.

    ×
    Preview Image
    Mostrar mais avaliações
    Qual foi a sua experiência com esse curso? Conte para nós!