Foto da parte de cima de uma escadaria, em um prédio na cor branca, com grandes janelas de vidro e pilastras, com a luz solar entrando através delas.
Foto de Andrea G no Unsplash

Letramento informacional de dados: Onde devemos nos aprofundar?

Francisco Foz
12 min readNov 28, 2022

--

Existe um conceito intrínseco na maior parte dos desenvolvimentos de projetos e produtos: Melhoria contínua.

Mesmo depois de implementado um programa de letramento informacional de dados, surgirá a questão:

Onde devemos nos aprofundar para desenvolver ainda mais o programa? Ou mesmo, a própria área?

Foi desenhado como implementar um programa de letramento informacional de dado, durante o capítulo 9 do livro:

“Data Information Literacy: Librarians, Data, and the Education of a New Generation of Researchers” (clique aqui para acessá-lo).

Caso você esteja chegando agora neste texto, confira aqui a listagem dos demais.

Agora durante o capítulo 10 os autores trouxeram uma ideia que pode ser o caminho para continuar melhorando o programa e a área do letramento informacional de dados (LID).

A ideia foi em aprimorar as competências necessárias do LID, como futuras áreas de pesquisa para a melhoria do currículo.

E no texto de hoje, abordarei quais são elas, listando as principais habilidades de cada uma.

Cada habilidade dessa pode dar origem a uma ou mais pesquisas e se transformarem em um texto, que você pode escrever e contribuir com pessoas que estejam estudando sobre o tema (nada tão formal, simples assim como esse blog).

Caso escreva, me marque, que ficarei bastante alegre em ler e compartilhar. :)

Bora lá?!

Gif de um corredor de uma biblioteca, entre estantes com livros em diversas cores.

Sumário

Descoberta e aquisição de dados

Bancos de dados e formatos de dados

Conversão de dados e interoperabilidade

Processamento e análise de dados

Visualização e representação de dados

Gestão e organização de dados

Qualidade de dados e documentação

Metadados e descrição de dados

Culturas de prática

Ética e atribuição

Curadoria e reutilização de dados

Preservação de dados

Competência extra: Pensamento crítico

Considerações finais

Descoberta e aquisição de dados

Durante trabalhos de pesquisa científica é provável que seja necessário descobrir e/ou adquirir novos conjuntos de dados para comparar, analisar ou para até mesmo complementar os dados gerados da pesquisa.

Mas saber onde e como buscar conjuntos de dados e ainda avaliá-los se são relevantes pode não ser uma tarefa tão simples, pois necessita de conhecimentos: da área estudada; de fontes de informação da área; técnicos sobre dados e de uma visão crítica e reflexiva ao analisá-los.

“Um membro do corpo docente alertou que os dados podem não estar acessíveis ao público e será necessário questionar sobre sua existência e se caso existir, negociar o acesso.” — Relato do livro

As principais habilidades a se explorar nessa competência são:

  • Saber localizar e utilizar repositórios de dados disciplinares.
  • Saber avaliar a qualidade dos dados disponíveis de fontes externas.
  • Saber como importar dados para seu uso.

Bancos de dados e formatos de dados

Criar banco de dados para armazenagem pode ser uma boa escolha, dependendo da quantidade de dados e estrutura que eles possuem.

Existem diversos tipos de sistemas de gerenciamento de banco de dados e até mesmo diversos tipos de dados, então qual deles será a melhor escolha? Ou melhor, em quais situações cada um deles será a melhor escolha?

Escolher um melhor formato de dados (XML,CSV, TXT, JSON…) para operacionalizar as manipulações também é importante, principalmente pensando no ciclo de vida dos dados dentro do projeto.

As principais habilidades a se explorar nessa competência são:

  • Entender o conceito de modelagem de dados relacionais e como consultar bancos de dados.
  • Estar familiarizado com os formatos de dados e tipos utilizados para cada área de pesquisa.
  • Entender quais formatos e tipos de dados são apropriados para diferentes questões de pesquisa.

Conversão de dados e interoperabilidade

Existe uma variedade de formatos de arquivos de dados, desde formatos livres até proprietários e é bem comum o processo de conversão entre eles.

Outra questão envolvida é a obsolescência dos formatos, principalmente em formatos proprietários. Entender que os softwares passam por atualizações e geram novos formatos é uma informação bastante relevante para se atentar em qualquer processo que se trabalhe com dados.

Um exemplo de mudança de formato de arquivos de dados é a do Excel: .xlx e .xlsx

As principais habilidades a se explorar nessa competência são:

  • Saber como realizar a conversão de dados de um formato para outro.
  • Compreender os riscos e possíveis perdas ou corrompimento de informações causada pela alteração dos formatos de dados.
  • Compreender os benefícios de tornar os dados disponíveis em formatos padrão para facilitar o uso.

Processamento e análise de dados

Nem sempre os dados coletados estão prontos para se analisar e necessitarão de limpeza, transformação, agregação… para depois serem analisados.

Saber como e quais ferramentas utilizar durante esse processo é essencial.

Nesse tópico podem entrar as linguagens de programação, como R e Python, que podem ser utilizadas para o processamento de dados com mais velocidade, confiabilidade e reprodutibilidade.

Intrinsecamente a competência de processamento e análise de dados está a de “life long learning”, pois a cada momento se lançam novas ferramentas e é necessário entender se elas não poderão facilitar ainda mais esse processo.

As principais habilidades a se explorar nessa competência são:

  • Usar as ferramentas adequadas para automatizar o processamento (manipulação) repetitivo de dados.
  • Compreender o efeito que essas ferramentas podem ter nos dados.
  • Saber como analisar dados da área da pesquisa.

Visualização e representação de dados

Não adianta apenas processar os dados e obter as métricas exatas para a análise se não é possível comunicar de forma clara os resultados.

“Eu diria que é essencial porque é comunicação. Se não nos comunicarmos, não iremos fazer muito a longo prazo.” — Docente de ecologia/arquitetura paisagística

Sim! Visualização de dados é comunicação.

Essa foi a competência que recebeu maior importância entre os docentes, durante a pesquisa dos autores.

Eles ainda citaram o termo “Storytelling”, o que não sei ao certo o quanto já pode ter sido influenciado ou não pelo livro “Storytelling com dados” da Cole Knaflic, mas sem dúvidas seria uma excelente fonte bibliográfica para inserir e melhorar a competência com os alunos.

Poderia ser aplicado os conceitos aliado ao software escolhido para processar os dados.

Imagem da capa do livro “Storytelling com dados”.

As principais habilidades a se explorar nessa competência são:

  • Usar com proficiência ferramentas básicas de visualização.
  • Saber evitar representações enganosas ou ambíguas ao apresentar dados.
  • Ser capaz de escolher o tipo apropriado de visualização (mapas, gráficos, animações ou vídeos) com base no entendimento do motivo/propósito para exibir os dados.

Gestão e organização de dados

Gerenciar dados e organizá-los está muito ligado à estruturação e documentação realizada deles. Descrever as características dos conjuntos de dados e os procedimentos realizados (também relatando o porquê foi utilizado) é essencial para a organização deles.

Os autores também deixaram claro que nem todas essas habilidades deverão ser aprofundadas para todos os alunos de pós-graduação, talvez seja importante desenvolver essa cultura na universidade, porém sendo inserida gradualmente para eles.

As principais habilidades a se explorar nessa competência são:

  • Compreender o ciclo de vida dos dados, desenvolvendo planos de gerenciamento de dados e acompanhar a relação dos subconjuntos dos dados processados com os conjuntos de dados originais.
  • Saber como criar documentação e padronização de procedimentos operacionais para gerenciamento dos dados.

Qualidade de dados e documentação

Já temos um plano de gerenciamento do que será realizado, mas como de fato será realizado?

O plano de gestão de dados (assim como seu próprio nome já diz) é um plano de gestão e não de operacionalização. Também há a necessidade de se documentar e manter um “padrão” de prática nas operações diárias dos processos.

Um dos docentes relatou a necessidade de se entender a “história” pelo qual se passou as modificações dos dados e como o contexto de cada decisão de mudança pode afetar o que os dados possuíam em sua origem.

Utilizar linguagens de programação para manipular dados pode facilitar muito no processo de documentação de procedimentos, pois estará ali todas as etapas realizadas.

Um dos principais benefícios que vejo em utilizar linguagens de programação para manipular dados ao invés de outras ferramentas visuais é a facilidade da reprodutibilidade das etapas por qualquer pessoa que tenha o script e os dados.

Quando falamos em ciência aberta isso é bastante importante.

As principais habilidades a se explorar nessa competência são:

  • Saber reconhecer, documentar e resolver quaisquer problemas nos dados.
  • Utilizar metadados para facilitar uma compreensão de possíveis problemas com conjuntos de dados.
  • Saber documentar os dados o suficiente para permitir a reprodução de resultados de pesquisa e por terceiros.
  • Saber rastrear a origem dos dados e delinear claramente as versões de um conjunto de dados.

Metadados e descrição de dados

Metadados é um conceito que geralmente não é conhecido por pessoas fora da área da ciência da informação e computação.

“Metadados são habitualmente definidos simplesmente como dados descrevendo outros dados.”

Mesmo que o seu conceito seja entendido, também é importante saber como seu uso é para o ciclo de vida dos dados, desde a descrição e compartilhamento dos dados até mesmo a verificação da sua qualidade.

Tem esse artigo muito legal sobre metadados digitais, que se te interessa o tema, vale a pena a leitura.

As principais habilidades a se explorar nessa competência são:

  • Entender a lógica dos metadados e saber descrever os dados para que possam ser entendidos e utilizados por si mesmo e por outras pessoas.
  • Desenvolver a capacidade de ler e interpretar metadados de outras áreas.
  • Compreender a estrutura e o propósito das ontologias para facilitar um melhor compartilhamento dos dados.

Culturas de prática

Essa é uma competência que ainda precisa ser muito estudada.

Durante a pesquisa dos autores, os próprios docentes relataram que não sabiam de fato afirmar as práticas, valores e normas da área como um “padrão”.

“Mas é algo para o qual a maioria de nós está mal preparada. (…) E nós mesmos tivemos muito pouco treinamento nisso.” — Docente de arquitetura paisagística

Vale a reflexão para futuras pesquisas:

Dentre as áreas que consideram já possuírem um “padrão” , ela reflete a atual prática da pesquisa científica?

As principais habilidades a se explorar nessa competência são:

  • Reconhecer as práticas, valores e normas da sua área, disciplina ou subdisciplina escolhidas no que se refere ao gerenciamento, compartilhamento, curadoria e preservação de dados.
  • Reconhecer padrões de dados relevantes do seu campo (metadados, qualidade de dados, formatos) e entender como eles são aplicados.

Ética e atribuição

Ao se desenvolver uma pesquisa e gerar novos dados, de quem será a propriedade deles?

Essa é uma pergunta que deve ser respondida lá atrás no plano de gestão de dados e deve ficar bem claro em relação aos acordos realizados com os investidores sobre quais procedimentos e finalidades que serão realizados com os dados.

Há outras questões de propriedade intelectual que também devem ficar claras para os pesquisadores, principalmente em relação a quando e se deve patentear alguma ideia.

A área de propriedade intelectual, especificamente sobre patentes, é um tema bastante complexo e necessita de uma estratégia muito bem fundamentada, principalmente no Brasil onde o tempo para se conseguir o registro pode levar anos.

Pessoas bibliotecárias especialistas em patentes, podem auxiliar a desenvolver essa competência dentro do letramento informacional de dados.

As principais habilidades a se explorar nessa competência são:

  • Desenvolver uma compreensão das questões de propriedade intelectual, privacidade e confidencialidade dentro da disciplina quando se trata de compartilhar dados.
  • Reconhecer dados de fontes externas adequadamente.

Curadoria e reutilização de dados

O processo de curadoria de dados é a garantia da qualidade dos conjuntos de dados para que possam ser reutilizados dentro do seu ciclo de vida e também após o seu depósito.

Pesquisadores, não necessitam realizar uma curadoria completa, pois ela será uma função de pessoas bibliotecárias e/ou arquivistas de dados. Entretanto, entender todo esse contexto é importante. Inclusive para estruturar e organizar seus conjuntos de dados de acordo com seus respectivos objetivos.

Esse é um tema que os autores relataram desconhecimento por parte dos docentes entrevistados.

Caso se interesse por esse tema, tem esse texto bem legal sobre:

As principais habilidades a se explorar nessa competência são:

  • Reconhecer que os dados podem ter valor além do seu propósito original (para validar outras pesquisas ou para uso em outros contextos).
  • Ser capaz de distinguir quais elementos de um conjunto de dados provavelmente terá valor futuro para uso próprio da pesquisa e para pesquisas terceiras.
  • Entender que a curadoria de dados é um empreendimento complexo, muitas vezes caro, mas que não deixa de ser essencial para o desenvolvimento da pesquisa.
  • Reconhecer que os dados devem ser preparados para sua eventual curadoria desde sua criação e durante seu ciclo de vida.
  • Saber articular o planejamento e as atividades necessárias para permitir a curadoria de dados, tanto para uso local quanto para uso geral.
  • Entender como citar dados, bem como como tornar eles citáveis.

Preservação de dados

Esta competência está muito conectada à anterior. Explorar essa conexão, pode deixar mais claro para os alunos.

Eu acredito que a prática da preservação está muito mais ligada às atividades de bibliotecários e arquivistas, do que de pesquisadores. Entretanto, saber por quanto tempo será necessário realizar a preservação de cada versão de conjunto de dados gerado é uma avaliação que os pesquisadores devem contribuir.

Da mesma forma como a anterior, ainda foi um tema pouco conhecido entre os docentes entrevistados.

As principais habilidades a se explorar nessa competência são:

  • Reconhecer os benefícios e custos da preservação dos dados.
  • Compreender quais são as tecnologias, recursos e componentes organizacionais da preservação de dados.
  • Saber utilizar as melhores práticas na preparação de dados para sua eventual preservação durante o seu ciclo de vida.
  • Articular o valor potencial, a longo prazo, dos dados para si ou para outros e ser capaz de determinar um prazo de preservação adequado.
  • Compreender as necessidades de desenvolver políticas de preservação e ser capaz de identificar os elementos centrais de tais políticas.

Competência extra: Pensamento crítico

O pensamento crítico/reflexivo é considerado por algumas pessoas como uma soft skill muito importante para qualquer área.

Assim como também é uma característica fundamental de um indivíduo letrado informacionalmente (de acordo com o padrão de letramento informacional da ACRL — Association of College and Research Library), ela também é uma competência essencial que deve ser trabalhada no letramento informacional de dados.

Desde o planejamento, coleta, processamento, visualização, análise, curadoria… Em todas as outras competências é necessário também essa visão.

Agora fica a questão:

Como inserir o pensamento crítico em torno do letramento informacional de dados?

São diversas as formas e particularmente gosto bastante dessa vertente. Inclusive já escrevi um texto que resume um artigo científico sobre esse tema:

Considerações finais

O letramento informacional de dados é uma área bem extensa e podemos ver isso através de todas essas competências (e possíveis áreas de pesquisa).

Além de toda sua extensão, o desafio em torno dela é o equilíbrio de inserir essas competências no plano pedagógico dos alunos (de pós-graduação e de graduação também).

Uma das técnicas citadas no livro para suprir essa necessidade é a do scaffolding (veja esse texto explicando sobre), que é a inserção de poucos elementos, de forma espaçada, de acordo com sua necessidade.

Desta forma seria possível você conseguir letrar em todas elas, sem uma carga tão grande de conteúdo e com uma conexão real com o contexto do aluno.

Fica aqui também a minha contribuição com um resumo visual das áreas:

Imagem do mapa mental informando as 12 futuras áreas de pesquisa do letramento informacional de dados.

Agora me diga, em qual dessas áreas você mais se identificou? Ou quais delas?

Deixe nos comentários e vamos trocar conhecimento.

Se você chegou até aqui e curtiu, dê palmas, compartilhe e se inscreva para me acompanhar.

Ainda há muito a se explorar.

Textos anteriores

Caso você ainda não tenha lido os textos anteriores, não deixe de conferir eles:

--

--

Francisco Foz

Bibliotecário | Analista de dados | Disseminando informações para produzir conhecimento.