O Centro de Política e Economia do Setor Público (CEPESP) da Fundação Getulio Vargas (FGV) disponibiliza diversas bases de dados eleitorais para serem utilizadas em pesquisas, o CEPESP DATA.
O CEPESP DATA facilita o acesso integrado às bases de dados fornecidas pelo Tribunal Superior Eleitoral (TSE) em seu repositório público. Ele foi desenvolvido com apoio da FAPESP (processos 2013/15658-1 e 2019/27645-8), da Rede de Pesquisa e Conhecimento Aplicado da FGV e do TSE.
O CEPESP DATA é uma plataforma de acesso a dados eleitorais brasileiros desenvolvida pelo Centro de Política e Economia do Setor Público (CEPESP) da Fundação Getulio Vargas (FGV), com coordenação do professor Dr. George Avelino Filho.
O CEPESP DATA não é um projeto open-source. Caso faça uso das informações, o banco de dados do CEPESP DATA deve ser citado utilizando o seguinte modelo:
FGV CEPESP (2024). CEPESPDATA - Banco de Dados Políticos. Visitado em XX/XX/XXX. Disponível em: https://cepesp.fgv.br/data
-
Fonte bruta do TSE: O CEPESP DATA é elaborado a partir dos dados disponibilizados pelo Tribunal Superior Eleitoral (TSE) no Repositório de Dados Eleitorais. O CEPESP DATA provê um repositório da atividade eleitoral no Brasil, a partir dos dados coletados, registrados e armazenados pelo TSE.
-
Um retrato do dia da eleição: Os dados do CEPESP DATA se referem especificamente ao dia da votação, por seção eleitoral, privilegiando na informação a vontade do eleitor. Esse é o único arquivo cujo resultado não é atualizado pelo TSE conforme decisões judiciais posteriores ao dia da eleição.
-
Integridade de dados originais: Não modificamos nenhum dado do TSE, tendo em vista a preocupação em manter a consistência com os dados originais e os de outras pesquisas. Falhas identificadas nos dados brutos são comunicadas ao TSE para que seja feita a correção na origem.
-
Consistência: O CEPESP DATA padroniza, simplifica, e complementa os dados do TSE para facilitar as análises de usuários. Os dados são nomeados e categorizados de forma compreensível, padronizando formatos e tipos de variáveis. Seguindo os princípios do tidy data, cada linha é uma observação; cada variável é uma coluna e cada tipo de observação uma tabela (exceto a da base de dados consolidada).
-
Facilitando a vida dos eleitores: Voltado para o grande público, o CEPESP DATA permite consultas rápidas sobre resultados eleitorais (no nível nacional, estadual, municipal ou local de votação), além do histórico eleitoral de candidatos específicos, que também podem visualizados através de mapas com a distribuição de votos.
-
Facilitando a vida dos pesquisadores: Os dados são acessíveis por meio de um website interativo. Variáveis, como, por exemplo, os códigos de município do IBGE, foram incluídas para facilitar a junção com outros bancos de dados. Em breve, será divulgada a nova versão da API, com suporte para pacote R e Python.
Este repositório se organiza nas seguintes pastas:
consulta_eleições
: Sequencia os scripts usados na construção das bases consolidadas do CEPESP DATA.tabelas_auxiliares
: Armazena scripts e bases auxiliares (e.g., número de cadeiras em disputa por distrito eleitoral, informações demográficas, referências geográficas) à construção dos dados consolidados do CEPESP DATA.testes_consistência
: Organiza scripts e bases consolidadas referentes erros nos dados do TSE manipulados pela equipe do CEPESP DATA. Os scripts testam a consistência interna (segundo dados demográficos e legislação eleitoral vigente) dos dados mais recentes publicizados TSE.