Minerando dados em redes sociais: Facebook e Instagram

As redes sociais se tornaram enormes repositórios de dados sobre o pensamento e o comportamento humano. Praticamente tudo que acontece no mundo real tem seu reflexo neste mundo virtual, que por isso serve como um retrato praticamente perfeito do que acontece aqui fora. A velocidade com que a informação trafega pela internet ainda permitiu que este espelhamento seja instantâneo, de forma que é possível saber o que esperar ao olhar pela janela de sua casa, olhando antes pela janela do navegador.

As informações que as pessoas trocam espontaneamente nas redes sociais têm enorme valor social e econômico. Um instituto de pesquisa pode, por exemplo, observar as reações que as pessoas têm, e registram, nas redes sociais, frente a algum fato marcante no mundo real, e assim estabelecer correlações importantes para estudos sociológicos. Do lado comercial, as empresas têm usado informações originadas nos canais de comunicação das redes sociais para, por exemplo, descobrir padrões de consumo e sentimentos relacionados às suas marcas. Algumas redes sociais ainda oferecem serviços especializados para negócios como uma interface de loja dentro de sua plataforma, através dos quais é possível, por exemplo, monitorar as atividades relevantes de seus clientes. Estes dados são depois utilizados em campanhas de marketing ou estratégias de maior prazo de posicionamento no mercado.

O acesso a essas informações, que geralmente é chamado de mineração de dados (data mining), têm sido bastante facilitado já que as próprias redes sociais têm oferecido APIs para que os interessados possam interagir com este mundo de dados. Basta que o usuário obtenha um token pessoal para fazer requisições no banco de dados da rede em questão.

Como as redes sociais apresentam propostas diferentes para a interação entre seus usuários, cada uma vai oferecer informações de natureza diferente. O desenvolvedor deve levar isso em consideração na hora de decidir onde procurar os dados de que precisa.

Este artigo trata especificamente das características e das formas de minerar dados do Facebook e do Instagram.

Facebook

O Facebook começou como uma plataforma onde as pessoas podiam manter um “cartão de apresentação” virtual, discriminando informações pessoais e profissionais, além de hospedar suas fotos, publicar o que elas estavam pensando e conversar com seus amigos num formato de chat. Elas também podiam participar de grupos, criados em volta de interesses em comum. Atualmente, muito mais coisa acontece na plataforma, sendo possível jogar games, comprar produtos e serviços, e se relacionar diretamente com empresas. Muito mais do que uma rede estritamente social, hoje o Facebook também é uma rede de interesses, concentrando pessoas em torno de assuntos que elas acompanham.

O Facebook possui em sua base de usuários cerca de um quarto de toda a população mundial, sendo ainda um dos repositórios mais completos sobre cada um de deles. Tamanha imensidão de informações fez com que o Facebook se visse obrigado a estabelecer gradualmente controles de privacidade, para evitar que seus usuários fossem potencialmente explorados por agentes mal intencionados. Por isso, não é mais permitido obter várias informações pessoais a partir das APIs que a plataforma oferece, mas ainda é possível minerar dados de páginas públicas ou de sua própria criação.

Para usar uma API, o usuário interessado deve antes registrar uma aplicação na plataforma de desenvolvedores, a partir da qual ganha acesso controlado aos dados hospedados no Facebook. Ele pode então fazer o acesso usando os aplicativos fornecidos pelo próprio Facebook, ou então programaticamente. Um dos aplicativos mais poderosos em um contato inicial é o Graph API Explorer, que representa as interações sociais na forma de grafos, sendo que os nós indicam objetos (pessoas, empresas, lugares…) e as arestas indicam as conexões entre eles. Para ambientes de programação, existem bibliotecas que fazem o mesmo trabalho, permitindo trazer as informações diretamente dentro de um ambiente para seu posterior processamento. Os resultados das pesquisas (queries) realizadas através das APIs são apresentados no formato JSON, que é fácil de inspecionar e manipular.

No caso do Facebook, a mineração de dados de páginas é uma técnica de enorme valor na geração de insights, já que através dos grafos sociais, a variedade dos dados disponíveis é gigantesca. É possível, por exemplo, verificar quantas pessoas são fãs da página, o que representa a métrica mais básica de popularidade, recuperar as publicações mais recentes para ter uma ideia de frequência e conteúdo, e verificar as reações a essas publicações, como likes, compartilhamentos e comentários.

Instagram

A proposta do Instagram é diferente daquela do Facebook, já que esta rede se especializou no compartilhamento de imagens e vídeos a partir de smartphones, sendo portanto um repositório deste tipo específico de conteúdo. A maioria do que é publicado no Instagram é público, refletindo a ideia de ser uma vitrine do usuário para o mundo. Em vista disso, a presença de empresas e celebridades é outro ponto marcante da plataforma. Atualmente, sua base de usuários ultrapassa 1 bilhão de pessoas, sendo uma das redes sociais mais populares do mundo.

O acesso à API do Instagram também é dado pelo registro de uma aplicação na sua página de desenvolvedores. Além do texto que acompanha a publicação, as informações que podem ser recuperadas sobre postagens contêm metadados relacionados à imagem e/ou vídeo, indo desde sua resolução até sua localização geográfica. O desenvolvedor não tem acesso direto às imagens e vídeos postados, mas a links a partir dos quais este conteúdo pode ser recuperado. A plataforma também faz uso ostensivo das hashtags, o que acaba facilitando o trabalho de quem quer recuperar informações relacionadas a um tema específico.

Já que o principal conteúdo postado no Instagram é gráfico, o minerador deve considerar como recuperar informações a partir do processamento dos dados obtidos. Isto costuma ser feito com o uso de redes neurais especializadas em reconhecer objetos ou identificar rostos em imagens, por exemplo. Para esta tarefa, o minerador pode tanto desenvolver uma rede neural própria, ou utilizar algum serviço de visão computacional hospedado na nuvem. Além de servir para detalhar o conteúdo que determinado perfil no Instagram está veiculando, este tipo de material tem enorme potencial no próprio desenvolvimento dos sistemas de processamento para análise semântica de imagens.

E, claro, as métricas de popularidade também estão disponíveis para fácil recuperação.


Com o amadurecimento da área de big data, os dados que disponibilizamos nas redes sociais revelaram ter valor muito maior do que seu intuito original de comunicação e compartilhamento de ideias e momentos, já que podem também representar nossa reação frente a acontecimentos no mundo real, ou mesmo às publicações de outras pessoas ou empresas nas próprias redes. A mineração destes dados pode ter propósitos comerciais ou científicos, permitindo estabelecer correlações entre o posicionamento de uma empresa e o engajamento de seus consumidores, por exemplo. Além do poder descritivo conferido por esta análise, uma empresa pode entender melhor as necessidades do público que atende e assim se adequar para oferecer produtos e serviços mais adequados, aumentando sua participação no mercado como consequência. Com as APIs oferecidas pelas próprias redes sociais e o uso de bibliotecas em ambiente programático, recuperar estas informações está acessível a todos os interessados. A partir daí, os insights possíveis estão limitados à imaginação do analista.

11 comentários em “Minerando dados em redes sociais: Facebook e Instagram”

  1. Heitor Carvalho de Almeida Neto

    Tem algum vídeo de apresentação do curso? Estou interessado mais gostaria de conhecer melhor o curso para ver se ele vai atender as minhas necessidade.

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Esse site utiliza o Akismet para reduzir spam. Aprenda como seus dados de comentários são processados.