Imagem gerada com o Lexica.art

Como praticar Python Pandas para análise de dados?

Francisco Foz
4 min readFeb 14, 2023

Você faz um curso, assiste todas as aulas, faz todos os exercícios, mas depois não pratica e acaba esquecendo.

Principalmente com programação, se você não praticar, realmente esquecerá.

Se você se interessou neste texto, provavelmente já analisou dados com planilhas em Excel ou Google Sheets e esteja dando seus primeiros passos na programação, voltada para análise de dados.

Ou talvez já tenha utilizado outras ferramentas mais robustas, como o Power BI e até mesmo SQL ou R, porém Python ainda não é seu forte.

Aprender uma nova ferramenta, principalmente com programação envolvida, não é simples e exige prática.

Podem haver “barreiras”, principalmente se você está realizando uma transição de carreira…

Eu entendo bem como é isso, pois sou bibliotecário de formação e hoje atuo diretamente com análise de dados.

Eu já até escrevi um texto sobre isso:

Mas o texto de hoje será para te indicar como você pode praticar Python, utilizando Pandas e “de quebra”, trazer um projeto para seu portfólio.

Bora lá?!

Sumário

Por que usar Python para análise de dados?

Como usar Python Pandas ?

Como praticar Python Pandas para análise de dados?

Por que usar Python para análise de dados?

A análise de dados como prática, vai estar muito voltada para o negócio em si, entretanto o seu diferencial são as técnicas e ferramentas que você pode trabalhar.

Analisar dados pode ser feito com diversas ferramentas, porém Python é a 2ª linguagem mais utilizada por analistas de dados no Brasil.

Ficando atrás apenas de SQL.

Essa informação foi coletada através da pesquisa do State of Data 2021, na análise que eu fiz e você pode conferir neste repositório.

Mas por que Python é tão querida?

Python é uma linguagem de programação versátil e intuitiva que oferece uma série de ferramentas para análise de dados. Ela possui uma sintaxe simples, permitindo expressar conceitos em poucas linhas de código.

Além disso, possui o Pandas.

Pandas é uma das melhores bibliotecas mais adequadas de se manipular dados com Python.

Pandas é uma biblioteca de código aberto que fornece ferramentas de análise de dados robustas e fáceis de usar.

Ela fornece estruturas de dados eficientes para carregar, manipular, filtrar, transformar e resumir grandes conjuntos de dados numéricos, textuais e temporais.

Você pode usar o Pandas para importar e exportar dados, realizar análises estatísticas, criar visualizações e muito mais.

Dessa forma, Python Pandas torna a análise de dados mais simples, eficiente e intuitiva.

Como usar Python Pandas ?

Você pode utilizar o Python Pandas em ferramentas de desenvolvimento próprias para análise de dados, como o Jupyter Notebook ou o Google Colab.

Caso queira saber mais sobre elas, você pode conferir esse vídeo:

E esse texto:

Mas basicamente só será necessário instalar ele no Jupyter notebook (caso não esteja já instalado, como no Google Colab):

!pip install pandas

Depois de instalado, você pode usar o comando import (para importar o módulo Pandas em seu código):

import pandas as pd

Esse trecho “as pd” é um apelido que damos ao Pandas, para não precisar ficar repetindo seu nome por completo durante todo o código.

Pronto!

Agora você pode começar a trabalhar com os dados.

Você pode criar um DataFrame a partir de um arquivo CSV, manipular os dados e visualizar os resultados.

Como praticar Python Pandas para análise de dados?

Eu montei um desafio especialmente para você que quer praticar Python Pandas analisando dados.

Ele faz parte do #7DaysOfCode.

https://7daysofcode.io/

Neste desafio o seu objetivo será explorar os dados de empréstimos dos acervos do sistema de bibliotecas da UFRN.

Você poderá treinar suas habilidades de manipulação, visualização e análise de dados utilizando Python Pandas.

Ele é mais focado na análise exploratória de dados (AED), que é uma forma de extrair informações de dados através da observação de tabelas, medidas e visualizações. Além de informações, também é possível extrair muitas hipóteses e novos questionamentos.

Você passará por diversas funcionalidades que o Pandas pode oferecer, desde a importação de diversos formatos de dados, agregações, divisões e transformações de dados, e até a exportação de tabelas estilizadas em HTML com sua análise pronta para ser inserida em alguma aplicação.

Mas antes do desafio você pode se perguntar:

Por que uma biblioteca analisaria dados?

Bom, um dos objetivos de um sistema de bibliotecas universitárias é garantir o uso da informação para que seja produzido mais conhecimento. Para isso ocorrer, é necessário analisar e entender o cenário através dos processos, usuários e recursos existentes para tomar decisões assertivas.

Se você se animou, confira o link abaixo e comece o desafio:

https://7daysofcode.io/matricula/pandas

Agora me diga:

Você topa analisar dados com Python Pandas durante os próximos 7 dias?

Faça o desafio e me marque, que ficarei muito contente de ver seus resultados! :D

Se você chegou até aqui e curtiu, dê palmas, compartilhe e se inscreva para me acompanhar.

Ainda há muito a se explorar…

Sign up to discover human stories that deepen your understanding of the world.

Free

Distraction-free reading. No ads.

Organize your knowledge with lists and highlights.

Tell your story. Find your audience.

Membership

Read member-only stories

Support writers you read most

Earn money for your writing

Listen to audio narrations

Read offline with the Medium app

Francisco Foz
Francisco Foz

Written by Francisco Foz

Bibliotecário | Analista de dados | Disseminando informações para produzir conhecimento.

No responses yet

Write a response