Esse site utiliza cookies
Nós armazenamos dados temporariamente para melhorar a sua experiência de navegação e recomendar conteúdo do seu interesse.
Ao utilizar os nossos serviços, você concorda com as nossas políticas de privacidade.
Esse site utiliza cookies
Nós armazenamos dados temporariamente para melhorar a sua experiência de navegação e recomendar conteúdo do seu interesse.
Ao utilizar os nossos serviços, você concorda com as nossas políticas de privacidade.
Postado em 08 novembro 2022
Atualizado em 08 novembro 2022
Esse é um projeto simples no qual vamos utilizar Jupyter e Pandas para simular os mesmo gráficos da eleição presidencial de 2022. Os dados serão obtidos pelo site oficial do TSE.
Esse projeto irá usar apenas python como linguagem de programação.
Ferramenta | Papel |
---|---|
Python | Linguagem de programação |
Pip | Gerenciador de pacotes python |
Jupyter | Caderno de notas responsivo |
Pandas | Cria dados analíticos |
Matplotlib | Cria gráficos analíticos |
Estarei utilizando o WSL para windows. Assim, posso usar comandos de Linux no meu windows.
Primeiramente, começarei instalando o python2.
sudo apt update
sudo apt install python2
Verificamos se python2 foi instalado com sucesso.
python2 -V
Python 2.7.18
Uma vez que instalamos python, instalaremos o pip para python2.
sudo apt-get update
sudo apt-get install python-pip
Em seguida, verificamos se pip foi instalado com sucesso para python2.
pip2 -V
pip 20.3.4 from /home/xxxx/.local/lib/python2.7/site-packages/pip (python 2.7)
Agora, instalaremos o jupyter.
pip2 install jupyter
Se não houverem problemas, podemos iniciar Jupyter no nosso servidor local.
jupyter-lab
O comando acima irá gerar o endereço local com um token. Na primeira vez que acessarmos o endereço, este endereço terá que acompanhar o token.
Após intalar jupyter, iremos instalar pandas e matplotlib para finalmente começarmos com o projeto.
pip2 install pandas
pip2 install matplotlib
Para verificar se os dois pacotes acima foram instalados, podemos usar o seguinte comando:
pip2 list
Se os pacotes aparecerem na lista, eles foram instalados com sucesso.
O TSE disponilizou os dados das urnas no formato CSV. Para termos acesso a esses dados, entraremos no seguinte site: https://dadosabertos.tse.jus.br/dataset/resultados-2022.
Para baixar os dados, clicamos no botão explorar do site acima.
Após baixar os dados no nosso computador, carregamos o arquivo CSV no jupyter.
Se não houver problemas, podemos visualizar o arquivo ainda no Jupyter. Os dados providenciados pelo TSE não estão muito bem formatados, por isso usaremos o delimitador para separar os dados.
Criamos um novo arquivo com extensão ipynb. Nesse arquivo escrevermos todo o código.
import pandas as pd
import matplotlib.pyplot as plt
# Pegamos apenas a porcentagem dos votos dos dois candidatos
df = pd.read_csv('Historico_Totalizacao_Presidente_BR_2T_2022.csv', delimiter=";", usecols = [
"LULA_PE_VOTOS_TOT_ACUMULADO ",
"JAIR_BOLSONARO_PE_VOTOS_TOT_ACUMULADO "
])
# Para o código funcionar corretamente, trocamos a vírgula por ponto
df = df.replace(',','.', regex=True)
df = df.astype(float)
df.plot()
plt.show()
Com o pequeno código acima podemos obter o gráfico das urnas, como mostra a imagem abaixo.
Aprendemos que pandas é uma excelente ferramenta para o análise de dados. Apenas com poucas linhas de código, conseguimos obter o resultado acima.
Postagens mais vistas
Os 5 principais componentes do computador são a unidade de controle, unidade aritmética e lógica, memória, dispositivo de entrada e dispositivo de saída.
A porta é um número de 16 bits que é adicionado no final do endereço IP, insinuando qual aplicativo está vinculado e atuando nessa porta.
Rede local de computadores (LAN) é um conjunto de computadores ou dispositivos conectados uns aos outros de forma isolada em um pequeno local.