Bibliotecário em Ciência de Dados: Introdução ao mundo dos dados

Francisco Foz
5 min readJul 23, 2021

Os primeiros passos em Ciência de Dados.

Como já havia escrito em meu último artigo. Compartilharei o início da minha jornada como bibliotecário em ciência de dados através do livro “Data Science do Zero” de Joel Grus.

Em seu primeiro capítulo, o autor contextualiza e conceitualiza a ciência de dados. Ele também lança a ideia que ao final do livro nós já estaríamos prontos para aplicar os conhecimentos adquiridos em problemas de nossos interesses.

Será mesmo??

Confesso que fiquei cético em relação a esta afirmativa.

Mas também estou bastante animado para testar.

Lembrando, que ele também orientou já ter noções de lógica de programação em Python, para ter ao menos uma introdução a linguagem.

Para nós bibliotecários, sugiro fortemente que tenham feito um curso e/ou que se aprofundem paralelamente a leitura do livro.

Durante os próximos artigos, para explicar melhor os códigos, utilizarei a ferramenta do Google Colab, que é um serviço em nuvem, gratuito, que permite escrever código Python com o próprio navegador, sem nenhuma instalação, de fácil compartilhamento e acesso gratuito a GPUs.

Mas… Voltando ao livro.

Neste primeiro capítulo o autor traz alguns pontos chaves para já se ter noção do que a ciência de dados é capaz. Ele desenha com alguns códigos, mas enfatiza que o código não é importante neste momento, até mesmo porque no segundo capítulo, ele fará uma revisão geral nos fundamentos do python.

Como meu objetivo é simplificar e trazer as possibilidades para deixar um pouco mais interessante, eu trago os conceitos fazendo referência às possibilidades dentro da biblioteconomia.

CONECTORES-CHAVE

O ponto principal deste conceito é a identificação de “conectores-chaves” dentre o relacionamento destes dados. Para que assim possa se analisar e questionar a razão deles serem “conectores chaves”.

Este conceito para nós da biblioteconomia/ciência da informação é bem próximo e se refere ao uso da teoria dos grafos e da análise de redes.

Fonte: “Criação de grafos de tópicos do conhecimento baseada em genealogia acadêmica”

Esta análise de relacionamento de dados, permite estimar a relevância de uma informação singular dentro de um ambiente plural. Podemos usar como possíveis análises:

  • Quais são as áreas que mais pesquisam colaborativamente dentro de uma universidade?
  • Quais são os assuntos entre as linhas de pesquisa mais estudados dentro de uma universidade?

“AMIGOS DE AMIGOS”

Parecido com o conceito anterior, mas aqui a perspectiva está no relacionamento indireto destas relações.

O termo “Amigos de Amigos” que o autor usa, está ligado à alusão que ele utilizou no primeiro conceito, no qual teríamos relações de amizade entre pares, mas para aumentar as conexões, poderíamos averiguar os relacionamentos indiretos e surgir oportunidades para novas conexões.

Relacionar as conexões indiretas já é uma outra forma bastante relevante para conectar os dados, mas e se aumentarmos a complexidade dele?

Vamos usar com os exemplos de análises que iniciei no primeiro conceito:

Quais são as áreas que mais pesquisam colaborativamente dentro de uma universidade?

Conseguimos relacionar e fizemos relações indiretas entre elas. OK.

Agora, dentre essas áreas, quais são os assuntos entre as linhas de pesquisa mais estudados dentro de uma universidade?

Se houver assuntos semelhantes entre áreas que não se relacionam diretamente, pode ser uma oportunidade de novas relações ou no mínimo de compartilhamento mais efetivo dos dados de pesquisa!

O trabalho colaborativo entre as áreas é uma grande oportunidade para inovação!

E tudo isso é apenas um exemplo de como esses conceitos podem funcionar, se começarmos a pensar em redes se relacionando entre elas… Há muito campo para explorar.

ANÁLISES ESTATÍSTICAS

Esse é um conceito que possivelmente não surpreenda você que está lendo este artigo. Até mesmo porque é um dos conceitos principais da ciência de dados.

As análises quantitativas e qualitativas dos dados são primordiais para se extrair informações valiosas do “objeto” pesquisado.

Pode ser que para alguns a “barreira” com números, possa dificultar o processo, mas vale ressaltar que a grande importância estratégica é a pergunta.

O que você realmente quer saber sobre a informação, sobre seu usuário, sua comunicação e seu uso?

A partir dos dados relacionados, pode-se estabelecer alguns padrões e entender a razão deles, para que assim se desenvolvam análises preditivas do que possivelmente ocorrerá (haverão capítulos mais para frente que se aprofundarão nestes tópicos).

TÓPICOS DE INTERESSES

Esse é o último, mas um dos conceitos que mais me empolguei. ;D

O autor exemplifica através de uma “pesquisa de usuário” com campos delimitados no qual o usuário responderia quais assuntos ele teria interesse.

Com algumas poucas linhas de código e uma simples contagem de palavras é possível se estabelecer quais são os mais populares. Nesse primeiro momento com algumas limitações, principalmente a interesses com duas palavras.

Mas o que me empolguei é de utilizar esse conceito com dados coletados por outras formas, como por exemplo o próprio uso da informação.

Vamos pegar por exemplo um serviço de streaming, você consulta alguns títulos e utiliza outros, esses títulos estão indexados com tópicos, nos quais ao você contabilizar ponderadamente as ações estabelecerá uma análise muito importante sobre os tópicos de interesse de cada usuário ou de grupos de usuários.

Ao pensar no relacionamento destes conceitos, já começo a enxergar um início de um algoritmo para recomendar a partir de dados.

E por falar em streaming, existem os de vídeos, filmes, músicas e … Livros também!

Não é novidade, mas acredito que as bibliotecas digitais devem repensar melhor os seus serviços ao comparar com os serviços de streaming, principalmente na experiência de usuário.

E por trás de tudo isso… Muitos dados e análises a se fazer!

No próximo artigo entraremos no mundo Python, com alguns códigos e suas relações.

Se você gostou, me acompanhe porque a jornada só está começando!

Há muito a se explorar!

Sign up to discover human stories that deepen your understanding of the world.

Free

Distraction-free reading. No ads.

Organize your knowledge with lists and highlights.

Tell your story. Find your audience.

Membership

Read member-only stories

Support writers you read most

Earn money for your writing

Listen to audio narrations

Read offline with the Medium app

Francisco Foz
Francisco Foz

Written by Francisco Foz

Bibliotecário | Analista de dados | Disseminando informações para produzir conhecimento.

Responses (1)

Write a response

Muito Interessante, está sendo inspirador acompanhar essa jornada...

10