O que você aprenderá
- Extrair dados do seu perfil do LinkedIn, utilizando a API do LinkedIn e arquivos .csv
- Extrair e analisar informações como: conexões entre os usuários, convites enviados/recebidos e mensagens
- Gerar nomes de usuários falsos para mascarar as informações reais
- Explorar e visualizar dados relativos às empresas e cargos de seus contatos
- Utilizar a distância de edição (Levenshtein), similaridade n-grama e distância de Jaccard para medir a similaridade entre os cargos
- Agrupar os contatos baseado na similaridade entre os cargos, bem como gerar visualizações em HTML para melhorar a apresentação dos dados
- Utilizar APIs de localização para extrair a latitude e longitude dos contatos, com o intuito de capturar a cidade e país de cada um
- Visualizar a localização dos contatos dinamicamente com o Google Earth e a biblioteca Basemap
- Agrupar os contatos utilizando o algoritmo k-means da área de aprendizagem de máquina (machine learning)
- Aplicar técnicas de processamento de linguagem natural para analisar suas mensagens no LinkedIn
- Gerar nuvem de palavras com os termos mais frequentes das mensagens, bem como extrair entidades nomeadas
- Criar um classificador de sentimentos para extrair a polaridade das mensagens do LinkedIn
Requisitos
- Lógica de programação, principalmente estruturas condicionais e estrutura de repetição
- Programação básica utilizando a linguagem Python
- Não são necessários conhecimentos sobre o LinkedIn
Descrição
O LinkedIn é uma rede social altamente voltada para a experiência profissional com o intuito de gerar conexões e relacionamentos entre profissionais de diversas áreas. Os profissionais podem criar currículos e buscar empregos por meio da conexão com pessoas do mundo inteiro. Por exemplo, se você gostaria de trabalhar na área de Ciência de Dados, pode formar conexões com empresas e pessoas que trabalham nessa área, aumentando as chances de conseguir uma vaga. Por outro lado, as empresas conseguem buscar os candidatos ideais para suas vagas, de acordo com o currículo e habilidades fornecidas pelos usuários. Em 2017, o LinkedIn firmou-se como a maior plataforma de negócios e importante ferramenta estratégica tanto para profissionais quanto para empresas.
Dentro deste contexto, é importante que os profissionais saibam como utilizar os dados dessa rede sociais a seu favor. Para isso, o próprio LinkedIn disponibiliza uma série de bases de dados relacionadas ao seu perfil, nas quais é possível aplicar técnicas de Ciência e Análise de Dados para extrair insights importantes e interessantes sobre a nossa rede de conexões. Dessa forma, podemos responder perguntas como: Quais são os cargos principais das pessoas que estão conectadas a nós? Quais são as empresas que estão enviando convites para nosso perfil? Qual é a localização principal de nossos contatos? Nossa rede do LinkedIn é composta por pessoas e empresas relacionadas ao nosso trabalho? As empresas que quero trabalhar estão enviando convites para meu perfil? Essas e outras perguntas serão respondidas durante este curso, e com isso, você pode analisar se sua rede está de acordo com o que você almeja profissionalmente. Abaixo você pode observar os principais tópicos que serão implementados passo a passo:
- Extrair dados do seu perfil do LinkedIn, utilizando a API do LinkedIn e arquivos .csv. Caso você não tenha LinkedIn poderá acompanhar normalmente o curso, pois serão disponibilizadas as bases de dados do meu perfil
- Extrair e analisar informações como: conexões entre os usuários, convites enviados/recebidos e mensagens
- Gerar nomes de usuários falsos para mascarar as informações reais
- Explorar e visualizar dados relativos às empresas e cargos de seus contatos (geração de gráficos dinâmicos)
- Utilizar a distância de edição (Levenshtein), similaridade n-grama e distância de Jaccard para medir a similaridade entre os cargos
- Agrupar os contatos baseado na similaridade entre os cargos, bem como gerar visualizações em HTML para melhorar a apresentação dos dados
- Utilizar APIs de localização para extrair a latitude e longitude dos contatos, com o intuito de capturar a cidade e país de cada um
- Visualizar a localização dos contatos dinamicamente com o Google Earth e a biblioteca Basemap
- Agrupar os contatos utilizando o algoritmo k-means da área de aprendizagem de máquina (machine learning)
- Aplicar técnicas de processamento de linguagem natural para analisar suas mensagens no LinkedIn
- Gerar nuvem de palavras com os termos mais frequentes das mensagens, bem como extrair entidades nomeadas
- Criar um classificador de sentimentos para extrair a polaridade das mensagens do LinkedIn
Durante o curso, vamos utilizar a linguagem de programação Python e também o Google Colab, ou seja, não é necessário gastar tempo instalando ou configurando ferramentas. Você conseguirá acompanhar o curso tendo um navegador simples e uma conexão com a Internet! Este é o curso ideal caso seja seu primeiro contato com análise de dados de redes sociais!
Para quem é este curso
- Qualquer pessoa interessada em análise de dados utilizando dados de redes sociais
- Pessoas interessadas na aplicação de técnicas de Inteligência Artificial e Ciência de Dados em dados extraídos de redes sociais
- Pessoas interessadas em extração de dados de redes sociais
- Alunos de graduação que estão estudando disciplinas ligadas a área de Inteligência Artificial, Ciência de Dados ou Análise de Dados
- Pessoas que queiram conhecer melhor seus contatos do LinkedIn
Publicado em janeiro de 2021
Que bom que gostou Maikon! 🙂
Sobre os exercícios, note que nas seções do curso tem alguns, juntamente com as soluções. Para este curso, o melhor exercício é fazer os testes com sua própria rede do LinkedIn