10 Bibliotecas para visualizar dados com Python
A visualização dos dados é essencial em ciência de dados, seja na parte inicial da exploração dos dados ou na final com a apresentação dos resultados.
Diversas ferramentas podem ser escolhidas para “plotar” os gráficos e a escolha delas dependerá das necessidades do projeto e das habilidades do time envolvido.
Nesse texto irei traz 10 bibliotecas para visualizar dados com Python.
Bora lá?!
Sumário
Matplotlib
Seaborn
Pygal
Bokeh
Altair
Ipyvolume
Plotnine (ggplot2)
GeoPandas
Plotly
Holoviz
Matplotlib
Se você já foi introduzido no mundo de ciência de dados com Python, com certeza já deve ter conhecido o Matplotlib.
Um ferramenta básica, mas muito poderosa pela quantidade de gráficos que é possível criar e desenvolver.
O Pandas utiliza o Matplotlib por detrás dos panos para criar os gráficos dele.
Você também pode conferir esse meu texto utilizando essas ferramentas:
Visualização dos dados de teses e dissertações de biblioteconomia do Brasil com Python
Seaborn
Baseada no Matplotlib, o Seaborn é uma biblioteca com gráficos elaborados mais fáceis de se realizar.
Eu particularmente gosto muito do boxplot com ele.
Pygal
Mas nem só de gráficos estáticos vivem os projetos de ciência de dados.
Com o Pygal é possível conseguir passar o mouse por cima da coluna de um gráfico e ele abrir uma dica de ferramenta.
Confira a documentação aqui.
São diversos os tipos de gráficos que ele faz.
Bokeh
Outra ferramenta para criação de gráficos dinâmicos e mais complexos é o Bokeh. Esta biblioteca cria visualizações baseadas em Javascript mas totalmente em Python.
Confira a documentação aqui.
Gráficos complexos dinâmicos:
Ou gráficos com filtros interativos:
Vale a pena conferir.
Nesse texto (em inglês) está uma comparação com a D3 do Javascript, que já adianto… é incrível o poder da biblioteca.
Altair
Outra biblioteca com gráficos interativos e dinâmicos é a Altair.
Baseada no Vega e no Vega-lite ela implementa gráficos bonitos e dinâmicos de forma simples.
Agora esse sim é ligado a D3 do Javascript, que você pode conferir esse texto (em inglês) sobre de como ele funciona.
Ipyvolume
Agora se você deseja visualizar gráficos 3D o Ipyvolume pode te ajudar.
Confira a documentação aqui.
Plotnine (ggplot2)
Se você já está nessa jornada da ciência de dados já deve conhecer ou ter ouvido falar do ggplot do R.
Ou mesmo se você ama trabalhar com ele em R, apenas deve usar o Plotline que implementa os gráficos baseados nele.
Confira a documentação aqui.
Ou também confira esse guia (em inglês) implementando o ggplot no Python.
GeoPandas
Uma biblioteca para trabalhar com dados geoespaciais. Não necessariamente uma biblioteca de visualizações, por que ela utiliza o Matplotlib por detrás.
Mas com mais facilidade o GeoPandas cria gráficos de mapas.
Confira a documentação aqui.
Plotly
Não poderia faltar a nesta lista esta biblioteca fantástica.
O próprio Paulo Vasconcellos do Data Hackers já escreveu sobre ela:
Uma biblioteca com gráficos dinâmicos poderosos e até mesmo com a possibilidade de criação de dashboards interativos.
Confira a documentação aqui.
Holoviz
Esta biblioteca é um conjunto de pacotes para que você possa trabalhar com visualizações.
Extremamente poderosa a Holoviz, permite que você possa criar painéis com gráficos de diversas ferramentas integradas.
Considerações finais
Tive como referência esses dois textos, além de outras leituras anteriores:
AS 8 PRINCIPAIS BIBLIOTECAS PYTHON PARA VISUALIZAÇÃO DE DADOS
Agora me diga, você conhece mais alguma outra? Compartilhe nos comentários e vamos trocar conhecimentos.
Se você chegou até aqui e curtiu, dê palmas, compartilhe e se inscreva para me acompanhar.
Ainda há muito a se explorar…