O que você aprenderá
- Aprenda os conceitos básicos de processamento de linguagem natural, como: part-of-speech, lematização, stemização, stop words, parsing de dependências, semelhança entre palavras e tokenização
- Utilize a biblioteca spaCy e o Google Colab para suas implementações de processamento de linguagem natural
- Crie um classificador de sentimentos utilizando uma base de dados do Twitter em português
- Crie implementações de processamento de linguagem natural no idioma português
- Treine modelos de machine learning utilizando o spaCy
Requisitos
- Lógica de programação, principalmente estruturas condicionais e de repetição
- Básico da linguagem Python é desejável, porém, é possível acompanhar o curso sem dominar essa linguagem com profundidade
Descrição
A área de Processamento de Linguagem Natural – PLN (Natural Language Processing – NLP) é uma subárea da Inteligência Artificial que tem como objetivo tornar os computadores capazes de entender a linguagem humana, tanto escrita quanto falada. Alguns exemplo de aplicações práticas são: tradutores entre idiomas, tradução de texto para fala ou fala para texto, chatbots, sistemas automáticos de perguntas e respostas, sumarização de textos, geração automática de descrições para imagens, adição de legendas em vídeos, classificação de sentimentos em frases, dentre várias outras!
Atualmente, este setor está cada vez mais necessitando de soluções de Processamento de Linguagem Natural, ou seja, aprender essa área pode ser a chave para trazer soluções reais para necessidades presentes e futuras. Baseado nisso, este curso foi projetado para quem deseja crescer ou iniciar uma nova carreira na área de Processamento de Linguagem Natural, utilizando a biblioteca spaCy e a linguagem Python! O spaCy é uma biblioteca desenvolvida com foco no uso em ambientes de produção, possibilitando a criação de aplicativos que processam e entendem grandes volumes de texto. Ela pode ser usada para extrair informações, entender linguagem natural ou preprocessar textos para posterior uso em modelos de deep learning.
O curso está dividido em três partes:
- Na primeira você vai aprender os recursos mais básicos de Processamento de Linguagem Natural utilizando o spaCy, como: part-of-speech, lematização, stemização, reconhecimento de entidades nomeadas, stop words, parsing de dependências, semelhanças entre palavras e tokenização
- Na segunda parte criaremos um classificador de emoções utilizando frases em português, utilizando 100% os modelos de machine learning disponibilizados pelo próprio spaCy
- Por fim, na terceira e última parte, criaremos um classificador de sentimentos utilizando uma base de dados do Twitter com textos em português
Utilizaremos tecnologias modernas, como a linguagem Python e o Google Colab, garantindo que você não tenha problemas com instalações ou configurações de softwares na sua máquina local.
Para quem é este curso
- Pessoas interessadas em Inteligência Artificial, Mineração de Textos ou Processamento de Linguagem Natural
- Pessoas interessadas na biblioteca spaCy
- Alunos de graduação e pós-graduação que estão estudando disciplinas ligadas a área de Inteligência Artificial
- Alunos que querem aprender passo a passo como funciona a área de classificação de textos
.