A influência da Ciência de Dados em campanhas políticas

Entenda como o emprego das tecnologias certas pode ser determinante na hora de traçar o perfil do eleitor ideal

 

Desde a virada do século, cada vez mais mudanças importantes vêm acontecendo na mobilização de campanhas eleitorais. Comícios presenciais têm perdido força e o candidato com maior tempo e exposição nos meios televisivos e radiofônicos tradicionais não é mais, por via de regra, aquele com os meios mais seguros para ser o vitorioso.

Em um cenário em que as redes sociais viraram verdadeiras praças e fóruns de discussão política, a presença de um candidato em meio a seus possíveis apoiadores se faz cada vez mais necessária. Aqueles que vão às urnas querem poder votar em alguém que fale a sua linguagem: a da internet. 

Estratégias nesse sentido já se mostraram favoráveis, mas elas não surgiram do nada. O que se mostrou decisivo em muitos desses casos foi todo um aparato de Data Science atuante nos bastidores. Acompanhe:

Segmentando o eleitorado

A propaganda política pensada para os meios de  comunicação tradicionais tende a focar em preocupações gerais, ao invés de desejos e anseios específicos. Nesse turbilhão de vozes e necessidades múltiplas amplificado pela internet, não é à toa que muitos eleitores sentem que a propaganda política feita pensada para o público das redes sociais seja capaz de se comunicar de forma muito mais precisa com eles.

A partir do que é publicado e compartilhado em diferentes mídias, tem-se em mãos os traços de personalidade próprios de determinados grupos, fazendo com que ele se torne alvo de campanhas de políticos e partidos que possam corresponder a suas especificidades. Cada clique, cada reação, cada compra, cada download, cada meme postado e cada publicação dizem respeito não só a um usuário, mas a toda sua rede de conexões. Todos os gostos e pretensões são facilmente revelados, facilitando a previsão de propostas que possam lhes atender, além da elaboração de outras novas.

Por trás, há um processo da análise desses dados ― envolvendo etapas de inspeção, limpeza e modelagem ―, até que eles se transformem em informações úteis e utilizáveis na tomada de decisão.

Não há mais um anúncio feito pensado para atingir a todos, portanto, mas uma pluralidade de anúncios pensada para atingir grupos cada vez menores, um por vez. Eles vão aparecer esporadicamente antes dos vídeos assistidos no YouTube, entre as partidas de seus jogos de seu celular, ou por meio de uma postagem promovida no Twitter.

“O Presidente Big Data”

Ao compreender o papel crucial que a Ciência de Dados pode assumir em estratégias eleitorais, o ex-presidente dos Estados Unidos Barack Obama ganhou a alcunha de “o presidente Big Data”. Em sua primeira campanha presidencial, ainda em 2008, seus comitês promoviam entrevistas com eleitores em potencial logo após os debates televisivos, a fim de verificar suas principais preocupações e preferências. Tudo isso era, então, processado por meio de diferentes algoritmos de Machine Learning para que fossem verificadas questões em comum que pudessem ser respondidas pelo plano de governo de Obama.

Mas foi em 2012 que esse planejamento se intensificou. Jim Messina, assessor do ex-presidente, declarou que o objetivo era monitorar tudo que fosse possível. Para tanto, foi precisa uma equipe composta por 1.000 funcionários pagos e outros 2.2 milhões de voluntários, que cuidavam de mais de 66 mil análises diárias.

Diversos e-mails eram enviados a seus apoiadores e sua equipe percebeu que, dentre os diferentes assuntos e abordagens do texto, aqueles enviados em nome de Michelle Obama, então primeira-dama, entregavam uma maior taxa de abertura e de cliques. Aqueles em nome do companheiro de chapa de Obama, Joe Biden, por outro lado, não eram tão populares. Otimizando as estratégias a partir dessas descobertas, 1 bilhão de dólares foram captados através de pequenas doações de pessoas físicas. Ao longo da campanha, a equipe de Obama gastou 52 milhões de dólares em anúncios online, o dobro do que foi gasto pela equipe do rival Mitt Romney.

A analítica preditiva também desempenhou um papel fundamental. Em estados-chave ― isto é, com maior número de eleitores ―, o monitoramento das intenções de voto foi mais forte do que no resto do país. Observando de perto os padrões de comportamento desse eleitorado, a verba para propaganda era alocada em mídias menos convencionais e mais específicas ao invés de ser direcionada a veículos de imprensa tradicionais, em um esforço para atrair indecisos.

Em um movimento pouco ortodoxo, Obama participou de uma sessão do “Ask Me Anything”  ― “Pergunte-me Qualquer Coisa”, em tradução livre ― do fórum de discussões Reddit. O quadro consiste em uma sessão de perguntas e respostas entre figuras notórias e os usuários da plataforma e poucas foram as figuras políticas a terem participado dele ― outros exemplos são o atual pré-candidato do Partido Democrata Bernie Sanders e o presidente Donald Trump, candidato à reeleição pelo Partido Republicano. O motivo para Obama ter participado foi o fato de sua equipe ter percebido, a partir de uma análise de sentimento feita em cima do site, que ele poderia converter vários de seus usuários em eleitores.

Em 2015, no fim de seu segundo mandato, Obama criou o cargo de Cientista de Dados Chefe, que ficou a cargo do matemático DJ Patil até 2017. Segundo ele, sua função era “liberar o poder da Ciência de Dados para beneficiar todos os cidadãos estadunidenses”. Patil fez parte do lançamento da Polícia de Dados da Casa Branca e da Iniciativa de Justiça Orientada a Dados da Casa Branca, coletando informações de atividades policiais com o objetivo de aprimorar os órgãos de segurança do país.

Monitorando o relevante

No decorrer das eleições municipais do Rio de Janeiro de 2016, a Twist lançou o primeiro eleicoes.live, uma edição do Twist Players orientada especificamente ao pleito. A interface, através de painéis próprios de cada candidato, permitia acompanhar os dados de suas redes sociais, suas menções em veículos da imprensa ― inclusive, com uma nuvem de palavras dos termos mais relacionado a eles ―, e a evolução das pesquisas de intenção de voto de cada um. Em publicação na revista VEJA Rio:

Em parceria com a Escola de Comunicação da UFRJ, a experiência foi repetida durante a eleição presidencial de 2018, quando saímos novamente na imprensa ― dessa vez, na coluna do Ancelmo Gois, do jornal O Globo.

Assim, pudemos acompanhar de perto toda a polarização nas redes que tomou conta daquele ano, com eventos como a impugnação da candidatura do ex-presidente Lula e a facada contra o atual presidente Jair Bolsonaro.

Os Estados Unidos estão, agora, no meio das primárias do Partido Democrata, em que os eleitores e filiados ao partido estão decidindo quem será o nome a enfrentar Donald Trump. A situação é a mais volátil possível: ao todo, mais de vinte candidatos já fizeram parte do processo, que hoje conta com apenas oito nomes e um intenso debate sobre quem seria a pessoa certa para unificar o bloco de oposição.

Nesse cenário, o portal de jornalismo guiado por dados FiveThirtyEight tem rodado diversos modelos preditivos, procurando saber quem será o escolhido em julho próximo. O principal deles mostra quem é o candidato com maior chance de receber mais delegados (segundo a legislação estadunidense, o voto do eleitor não vai diretamente ao candidato, mas a um delegado de seu estado que deverá representar essa escolha no colégio eleitoral). No momento em que essa postagem está sendo escrita, Bernie Sanders é o candidato com a maior probabilidade, segundo o portal. É possível, ainda, visualizar a evolução das pesquisas de opinião desde o ano passado.

Outra simulação se põe a prever quantos delegados representarão cada candidato na convenção nacional do partido, dos 1.991 necessários para que se ganhe a indicação. No momento, esta prevê que nenhum deles ganharia essa quantidade.

O que diz a legislação brasileira

Com a vigência da Lei Geral de Proteção de Dados, programada para agosto deste ano, fica proibida a coleta e a utilização de quaisquer informações pessoais em campanhas digitais sem a autorização do consumidor. Baseada na noção de consentimento, ela também proíbe a venda destes dados a outras empresas sem que isso seja acordado. 

Com a fiscalização correta, a cargo da Agência Nacional de Proteção de Dados, é difícil que haja um escândalo como o da Cambridge Analytica. A empresa de consultoria combinava técnicas de mineração, análise e tratamento de dados para basear as estratégias políticas de seus clientes, que incluem o próprio Donald Trump.

Em março de 2018, aproximadamente um ano e meio após a eleição deste, foi descoberto que a empresa armazenava informações pessoais de usuários do Facebook para bombardeá-los de propaganda política. Os dados foram coletados a partir de 270 mil usuários que permitiram que o aplicativo “thisisyourdigitallife” tivesse acesso não só as suas informações, mas a de seus amigos também, totalizando 87 milhões de perfis. Desde então, a API da rede ficou cada vez mais restrita.

Para o período eleitoral brasileiro de 2018, a minirreforma eleitoral aprovada no ano anterior impôs medidas que visavam uma maior transparência de toda propaganda eleitoral veiculada na internet. Assim, todo anúncio impulsionado com esses fins em plataformas como o Google ou o Facebook deveriam especificar seu patrocinador, além de seu CPF ou CNPJ.

 

Além do que já está sendo visto nas primárias estadunidenses e foi experimentado no Brasil durante as eleições de 2018, quando muitos postulantes ampliaram suas estratégias online ao longo do pleito, as eleições municipais deste ano já estão começando a ser desenhadas, com prazo máximo de filiação marcado para abril. A partir deste mês, é esperada maior movimentação partidária nas redes, estendendo-se até outubro.

Se você acha que a Twist tem as ferramentas certas de visualização e análise de dados, fale conosco! Para mais atualizações como essa, continue acompanhando nosso blog e assine nossa newsletter.

Se inscreva na nossa newsletter