Use a Cabeça! Análise de Dados

Para quem já leu os livros da série Use a Cabeça sabe que os conteúdos são extremamente didáticos e fáceis de serem assimilados, e nas 440 páginas do livro Use a Cabeça! Análise de Dados isso não é diferente! A série Use a Cabeça utiliza como base pesquisas em neurobiologia, teorias do aprendizado e ciências cognitivas, o que torna o aprendizado de temas complexos muito rápido e fácil.

O livro é destinado principalmente para pessoas que buscam encontrar padrões escondidos em dados, bem como utilizar esses dados para tomada de decisões estratégicas. Praticamente todos os conceitos do livro podem ser aplicados na prática por empresas e também por profissionais de TI que queiram criar novas ferramentas ou aplicativos integrados em softwares já existentes. O livro é composto por 13 capítulos e cada conteúdo é apresentado da seguinte forma: os leitores fazem parte da equipe de analistas de dados da empresa Use a Cabeça e são contratados para analisar dados de empresas em diversos cenários. Cada uma dessas empresas tem um grande problema e precisa dos analistas de dados para tomarem as decisões corretas. Neste contexto, os analistas (leitores) são apresentados aos dados da empresa e precisam encontrar a solução utilizando alguma técnica específica! Os exemplos procuram ser bem reais e é muito parecido com o que acontece no cotidiano de um analista de dados, o que torna a leitura agradável e o leitor pode ter uma ótima visão de como é trabalhar nesta área!

Vou agora detalhar o que tem em cada um dos capítulos, focando mais naqueles que tem mais ligações com Inteligência Artificial.

Com relação à aprendizagem de máquina, os principais capítulos são o 9 (Histogramas), 10 (Regressão) e 11 (Erro). Esses três capítulos formam uma sequência bastante interessante e explica como construir um algoritmo para prever aumento de salário. O exemplo prático é o seguinte: os funcionários de uma empresa querem pedir aumento salarial para os seus chefes, porém, eles não sabem exatamente quais variáveis são determinantes para receberem um bom aumento, ou seja, será que o ano, o sexo ou o valor pedido influenciam no aumento recebido? Com isso, no capítulo 9 são abordados os histogramas, que são gráficos de barras que mostram a frequência dos grupos de números para descobrir a resposta para essa questão. O capítulo 10 é sobre regressão, que é uma técnica de aprendizagem de máquina para prever valores numéricos. Neste contexto, é mostrado como criar um algoritmo para responder a seguinte pergunta: “Diga-me o que você vai pedir, e eu direi o que você deve receber”. Os cálculos de regressão são complexos, porém, com a didática da série Use a Cabeça esse conceito se torna até trivial, e o melhor, muito fácil para entender. Todos os conceitos matemáticos  são explicados de forma muito didática! Por fim, no capítulo 11 são abordados os erros que podem ocorrer nas previsões, bem como tratá-los e melhorar o algoritmo para que ele seja mais confiável.

O capítulo 6, por sua vez, aborda sobre estatística bayesiana e faz uma introdução ao Teorema de Bayes. Em aprendizagem de máquina existem alguns algoritmos que são baseados neste teorema, portanto é importante entendê-lo. É mostrado o exemplo de como fazer previsões se uma pessoa terá chances de contrair ou não a “gripe dos lagartos” baseado no resultado do exame médico. Além da aprendizagem de máquina, existe o conceito de redes bayesianas que também utiliza essa teoria. Essas redes são utilizadas para tomada de decisões com base em probabilidades, e abaixo você pode ver uma figura que mostra um exemplo de diagnóstico de um carro irá ligar ou não!

[images style=”0″ image=”http%3A%2F%2Fiaexpert.academy%2Fwp-content%2Fuploads%2F2016%2F06%2FRedes-bayesianas.png” width=”500″ align=”center” top_margin=”0″ full_width=”Y”]

No capítulo 8 é abordado sobre definição de heurísticas, conceito muito utilizado em inteligência artificial principalmente para resolução de problemas por meio de buscas (encontrar o melhor caminho em um mapa de cidades, por exemplo). Resumidamente, uma heurística é uma “maneira para resolver um determinado problema”, e é mostrado o exemplo da empresa Resíduos que precisa provar para a prefeitura da cidade que seu trabalho de conscientização sobre poluição tem resultados. E para isso, os analistas desenvolvem heurísticas! Para quem já fez alguma disciplina ou já estudou problemas de busca em inteligência artificial, eu recomendo fortemente a leitura deste capítulo!

No capítulo 13 o tópico abordado é limpeza de dados. Se você já trabalhou com bases de dados comerciais e/ou transacionais para criação de Data Warehouses, deve saber que os dados nem sempre estão em um padrão pronto para análise! Por isso, neste capítulo o autor mostra algumas técnicas no Excel e no R (software estatístico – https://www.r-project.org/) para colocar os dados em um padrão para que análises possam ser feitas. A parte principal abordada é a utilização de expressões regulares para filtrar e substituir dados inválidos.

Esses seis capítulos abordados acima (06, 08, 09, 10, 11 e 13) são os principais que tem fortes ligações com inteligência artificial, aprendizagem de máquina e até data warehouse. Os outros capítulos também são muito interessantes e apresentam outras formas de trabalhar com os dados para tomar decisões estratégias. Vou agora apresentar resumidamente o que cada capítulo traz!

O capítulo 1 é uma introdução e mostra como analisar dados (manualmente) para descobrir o público alvo de uma loja de cosméticos, enquanto que o 2 é focado em teste de teorias e aborda o exemplo de definição de preços de uma cafeteria. O capítulo 3 é focado em otimização e apresenta técnicas de pesquisa operacional para a definição da linha de produção de uma empresa de brinquedos. O capítulo 4 é também um dos mais interessantes, e mostra como utilizar gráficos de dispersão para descobrir qual o melhor layout de site uma empresa deve adotar, com base no número de cliques, visitas e tempo no site. O capítulo 5 aborda testes de hipóteses para saber o momento certo para lançar um novo produto, o 7 é focado em probabilidades subjetivas para tomada de decisões e por fim, o capítulo 12 apresenta conteúdo sobre bases de dados relacionais.

Para finalizar, o livro Use a Cabeça! Análise de Dados é ótimo e muito fácil de entender, com exemplos práticos muito didáticos e que podem ser aplicados na vida real! Abaixo seguem os dados completos do livro:

Título: Use a Cabeça! Análise de Dados
Autor: Michael Milton
Editora: Alta Books
Ano: 2010
Páginas: 440

Sobre o autor

5 comentários em “Use a Cabeça! Análise de Dados”

      1. Muito bom conceito do livro, achei um caminho e agradeço os profissionais de ti que amam a profissão e deixam seu legado, muito obrigado.

  1. Olá Jones,

    Tudo bem?

    Sou seu aluno no curso de “Formação Cientista de Dados com R e Python”. Parabéns pelo trabalho!

    Esse livro ainda é interessante agora em 2019 ou já temos opções mais atualizadas?

    Obrigado.

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Esse site utiliza o Akismet para reduzir spam. Aprenda como seus dados de comentários são processados.