O que você aprenderá
- Entenda as aplicações que podem ser desenvolvidas utilizando regras de associação
- Aprenda os conceitos teóricos sobre o algoritmo Apriori, bem como a configuração de seus parâmetros (suporte, confiança e lift)
- Aprenda como importar bases de dados reais para o formato para aplicação de regras de associação
- Entenda como configurar os parâmetros do algoritmo Apriori para obter melhores resultados em diversos cenários
- Entenda como utilizar as técnicas de regras de associação para descoberta de padrões em bases de dados comerciais
- Aprenda como pré-processar uma base de dados comercial utilizando o MySql
- Aprenda como seguir as etapas do processo KDD (Knowledge Discovery in Databases) para extrair conhecimento de bases de dados
Requisitos
- É recomendado conhecimentos básicos sobre lógica de programação, embora não seja um pré-requisito e é possível acompanhar o curso sem essas habilidades
- Não são necessários conhecimentos prévios sobre a linguagem Python ou sobre Inteligência Artificial
- É necessário saber ter um conhecimento básico sobre banco de dados, bem como comandos SQL básicos
Descrição
A descoberta de regras de associação é uma das subáreas da Mineração de Dados mais populares e que apresenta uma diversidade muito grande de aplicações práticas e comerciais! Se você estuda Inteligência Artificial, talvez já tenha ouvido falar daquele clássico exemplo das fraudas e cervejas! Caso não, há vários anos um mercado muito famoso descobriu um padrão bem interessante em seus dados: em certos dias da semana existiam muitas vendas em conjunto tanto de fraudas quanto de cervejas. De posse desse conhecimento, eles decidiram alterar a disposição das prateleiras do mercado e conseguiram otimizar as vendas desses dois produtos em conjunto (o que aumentou significativamente as receitas). O segredo disso é que eles usaram a técnica de regras de associação, que tem como objetivo a descoberta de padrões nos dados que não podem ser facilmente encontrados somente “batendo o olho” nos registros. Essa técnica utiliza um algoritmo (o mais famoso é o Apriori) que é capaz de descobrir esse tipo de associação, podendo ser aplicado nos mais variados cenários!
E neste curso você verá passo a passo o funcionamento do algoritmo Apriori, ou seja, dada uma base de dados você vai aprender como ele consegue gerar as regras de associação, bem como compreender como são feitos os cálculos de suporte, confiança e lift; que são as métricas mais utilizadas neste tipo de cenário. Utilizaremos a linguagem Python e o banco de dados MySql para o desenvolvimento dos exemplos. Inicialmente trabalharemos com duas bases de dados prontas de mercado e o objetivo será analisar as associações que podem ser encontradas entre os produtos que são vendidos em conjunto, processo conhecido como Market Basket Analysis (análise de cestas de mercado). Logo depois, utilizaremos duas bases de dados reais: a primeira de uma pizzaria (inclusive a pizzaria era minha!) e a segunda de uma pesquisa sócio-econômica de alunos que fizerem o vestibular em uma universidade! A ideia é realizar o processo KDD completo (Knowledge Discovery in Databases – Descoberta de Conhecimento em Bases de Dados) nessas duas bases de dados, passando pelos processos de seleção de atributos, pré-processamento e transformação dos dados antes de realizar as análises com o algoritmo Apriori. O objetivo dessas seções é que você tenha uma visão prática e comercial de como funciona esse processo em bases de dados comerciais, visto que a maioria dos materiais sobre o assunto abordam somente a aplicação do algoritmo e deixa de lado todo o processo de preparação das bases de dados!
Por fim, ainda teremos mais um módulo adicional que mostrará como importar uma base de dados fictícia de mercado para um padrão na qual as análises possam ser realizadas. Nessas aulas, é mostrado passo a passo como realizar a conexão do Python com o MySql e realizar as consultas para obter os dados no padrão requerido para aplicação do Apriori. Esse módulo é útil caso você tenha uma base de dados no modelo Entidade Relacionamento e deseja aprender os processos básicos para conversão dos dados. Ao final do curso, você será capaz de implementar suas próprias análises e em suas próprias bases de dados, o que pode abrir diversas oportunidades de negócio e de renda extra para você! É importante enfatizar que este curso é para todos os níveis, seja para você que está iniciando nessa área ou para você que já possui conhecimentos sobre regras de associação e deseja conhecer mais sobre o assunto.
Para quem é este curso
- Pessoas interessadas em Inteligência Artificial e Mineração de Dados
- Pessoas que queiram fazer análise de dados em bases de dados comerciais
- Alunos que desejam utilizar regras de associação para encontrar padrões em bases de dados
A biblioteca não está defasada, ainda é uma das melhores opções para regras de associação com Python. Este curso é de 2017, porém, temos um mais novo (Kaggle Curso 2) que também usa ela e é de 2020