Photo by Praveen Thirumurugan on Unsplash

Por que uma pessoa bibliotecária de dados deveria conhecer Git e GitHub?

Francisco Foz

--

Se não é o seu primeiro dia no mundo da tecnologia/desenvolvimento com certeza você já deve ter ouvido falar sobre Git e GitHub. Mas se você não sabe, não tem problema também.

Git é um sistema de controle de versão, para as modificações ocorridas nos arquivos. Desta forma, você consegue “voltar no passado”, comparar ou realizar mudanças nos arquivos.

GitHub é a plataforma de hospedagem dos códigos e arquivos utilizando o Git. Ela possibilita que os usuários, possam compartilhar códigos, disponibilizar projetos Open Source e mais um monte de outras funcionalidades.

Se você quiser saber mais, leia esse texto.

Mas e o que isso tem haver com biblioteconomia de dados?

A biblioteconomia de dados é responsável pelo desenvolvimento de novos produtos e serviços para a unidade de informação utilizando dados. A pessoa bibliotecária de dados necessita saber extrair, manipular, analisar e apresentar dados.

Bem… manipular dados pode ser de diversas formas, mas uma das principais é através de linguagens de programação, como Python por exemplo.

Ao desenvolver códigos de manipulação de dados, como essa pessoa poderá controlar o versionamento do seu código?

Ou mesmo como ela poderá apresentar o seu código com as etapas realizadas para que uma outra pessoa possa reproduzir de fato as mesmas etapas?

Git e GitHub.

No texto de hoje eu irei trazer alguns conceitos introdutórios sobre essas tecnologias e algumas dicas de onde você poderá conhecer mais sobre elas.

Bora lá?!

Sumário

Introdução

Comandos básicos

Repositórios

Praticando a documentação e o versionamento de dados

Onde aprender?

Introdução

Começar no “mundo Git” através do terminal provavelmente poderá ser assustador para pessoas bibliotecárias.

Quando fiz meu primeiro curso de git e foi em linha de comando no terminal eu fiquei meio assustado. SPOILER: Terminal também não é coisa de outro mundo.

Então, faça seu login no GitHub e comece a configurar sua conta.

https://github.com/

Super aconselho qualquer pessoa já fazer o exercício de estilizar seu próprio README no GitHub, já é um passo muito legal para você ir treinando a escrita no markdown também.

Confira esses artigos de como criar o seu README:

E esse outro:

Depois do seu README, você poderá começar a criar seus repositórios. Repositórios de projetos que vocês está criando, cursos realizados ou mesmo da sua pesquisa atual e já ir subindo usando o GitHub direto do navegador.

Mas às vezes os arquivos podem ficar pesados ou você só quer ir salvando eles e subindo para seu repositório. Então você pode recorrer ao GitHub Desktop, onde você pode fazer tudo isso direto do seu computador (ainda sem linhas de comando).

Com o VSCode tem diversas integrações automáticas também (mais para frente indico onde você pode aprender a utilizar com essa ferramenta também).

Comandos básicos

Alguns dos comandos básicos do git são:

GIT pull : Ele irá “puxar” o conteúdo do repositório remoto para o seu repositório interno e já atualizar sincronizando os conteúdos.

GIT add: Depois que você fez as modificações nos arquivos, esse comando irá “adicionar” os arquivos solicitados no “pacote” para próxima atualização. É comum usar com um ponto final depois do add (GIT add . ) para adicionar todos os arquivos.

GIT commit: Devemos então “fazer” as alterações preparadas e este comando é o principal executor. Geralmente acompanhado de um comando com sua mensagem, por exemplo: GIT commit -m “Atualizando a classe X…”

GIT push: Alterações realizadas ? OK!? Vamos realizar elas no repositório remoto. “GIT push” e acabou.

Esses comandos são utilizados principalmente no terminal, mas é muito importante você saber o que é cada etapa, mesmo que visualmente no navegador ou no GitHub Desktop.

Repositórios

Os repositórios são os ambientes reservados para você subir e documentar os arquivos de um projeto.

Que poderá ser público ou privado, você que determina as configurações.

É muito importante manter um README com a descrição e pastas organizadas e alinhadas ao escopo do projeto.

Por exemplo, esse aqui é o repositório do meu projeto final do bootcamp de data science (se você quiser saber mais sobre minha experiência durante o curso veja esse outro texto).

Mas você não precisa apenas subir arquivos ou projetos para explorar a ferramenta, você também pode pesquisar o que todas as pessoas desenvolvedoras no mundo inteiro estão compartilhando!

Você pode vir na barra de pesquisa e colocar algum tema:

Eu coloquei o termo “data librarian” e você pode navegar pelo tipo de material que deseja pesquisar, como repositórios, commits e até mesmo usuários.

Uma excelente forma de se descobrir coisas novas!

Bom, se eu ainda não te convenci até agora sobre a importância de Git e GitHub para pessoas bibliotecárias de dados. O primeiro repositório que apareceu no campo de busca é de uma pessoa na alemanha que começou a colocar os materiais do curso de “Data Librarian” em um repositório. Sabe qual é um dos assuntos que até mesmo tem um “cheatsheet” (um resumo com os principais comandos)? Git e GitHub.

Tem muita coisa para você explorar e encontrar no GitHub.

Praticando a documentação e o versionamento de dados

Biblioteconomia de dados é um embrião ainda, principalmente no Brasil, principalmente para instituições menores ou mesmo sem muita infraestrutura.

Já atuei como um bibliotecário em uma faculdade e sei como é a realidade.

“Não vamos romantizar então.”

Você pode atuar em uma instituição e tem a vontade de iniciar um projeto para e desenvolver uma “cultura de dados”. Documentar e controlar o versionamento de dados é essencial para se iniciar a padronização em uma instituição.

Seria ideal você ter um repositório da instituição, com uma página da web destinada a isso, com controle da documentação, versionamento, logins, acessos e etc.

Então, por que não usar o GitHub como parte dessa estrutura?

Algo que aprendi no meu trabalho atual é: “O ótimo é inimigo do bom”. Se você não puder achar alternativas para implantar e iniciar, provavelmente as coisas não saiam do lugar.

Claro, tomando todo o cuidado com governança e etc.

Essa é uma opinião pessoal, mas que acredito que pode gerar muito valor para instituições menores (bibliotecas escolares, bibliotecas públicas e até mesmo de algumas faculdades) implantarem uma cultura de gerenciamento de dados.

Pode ser que você erre, pode ser que eu esteja errando… mas é esse movimento que precisamos fazer para transformar.

Onde aprender?

Tem muuuito material gratuito na internet para você conhecer mais sobre Git e GitHub.

A Alura, tem uma websérie com 11 vídeos no seu canal do Youtube.

Esse aqui é o primeiro da série:

A Alura também tem uma iniciativa incrível, chamada 7 Days of Code.

Durante 7 dias, você receberá um desafio por dia no qual poderá praticar mais sobre alguma tecnologia.

https://7daysofcode.io/

E eles também tem de GitHub! \0/ \0/

Se inscreva aqui. É totalmente gratuito.

Você poderá praticar muito mais as integrações do VSCode com Git aqui.

SPOILER: No último dia, você aprenderá até mesmo a subir uma página na web com o GitHub pages.

Se você quiser se aprofundar mais a Alura também tem cursos em sua plataforma sobre as ferramentas.

Link
Link
Link

Caso você não seja aluna(o) ainda, confira meu cupom de desconto especial aqui.

Para ficar atualizada nas novidades, não deixe de seguir a Pachi Parra em todas as suas redes sociais. Ela é dev advocate no GitHub e traz muita, muita coisa legal, principalmente lá no seu dev.to.

Link

Se você ainda quer mais conteúdo, não deixe conferir esses episódios do Hipsters:

Link
Link

E você, já conhecia sobre Git e GitHub?

Se sim, comente o que você mais gosta dessas ferramentas.

Se não, comente qual foi sua primeira percepção.

Se você chegou até aqui e curtiu, dê palmas, compartilhe e se inscreva para me acompanhar.

Ainda há muito a se explorar…

--

--

Francisco Foz
Francisco Foz

Written by Francisco Foz

Bibliotecário | Analista de dados | Disseminando informações para produzir conhecimento.