Photo by Ishan Gupta from Unsplash

3 Estratégias para ler e extrair significado de conjuntos de dados

Francisco Foz
5 min readMay 17, 2022

--

há anos estamos vivendo uma explosão do mundo dos dados. As pessoas, as empresas e a sociedade como um todo já entenderam o valor.

Frases como:

“Dados são o novo petróleo”

Podem já soar até mesmo clichê , devido a todas as ferramentas, métodos e estruturas que estão sendo utilizadas nos dados.

Analisar dados é algo que cada vez mais se torna inerente a qualquer profissão. Alguns especialistas já disseram que daqui alguns anos, será uma habilidade comum, assim como hoje é navegar na internet percorrendo informações.

Pode ser que isso ocorra… mas assim como hoje já existem problemas em como as pessoas procuram, acessam e interpretam informações também haverá com os dados. Para a informação já existe uma área que desde a década de 70 estuda isso e é o Letramento informacional (indico esse livro incrível sobre o tema), mas e para os dados?

O Letramento de dados surge para que possa preparar as pessoas em como ler, analisar, gerenciar e tomar decisões a partir de dados.

Ler dados pode parecer uma tarefa puramente estatística e matemática a primeiro momento, mas convido você a refletir um pouco mais sobre outras perspectivas mais humanísticas, como o próprio significado dos dados:

Sobre o que são esses dados?

Como eles foram originados?

Porque apenas estes dados foram coletados?

Por quem eles foram originados?

No artigo científico:

Reading datasets: Strategies for interpreting the politics of data signification

A autora traz 3 estratégias para se ler um conjunto de dados, apresentadas no seu curso “Data and Society” da Universidade da Califórnia em Davis e eu introduzirei eles para vocês.

Borá la?!

Sumário

Dados enviesados

Leitura Denotativa

Leitura Conotativa

Leitura Desconstrutiva

Conclusões

Referências

Dados enviesados

Há algum tempo já se entendeu que os conjuntos de dados não são neutros e que eles podem refletir problemas enormes quando potencializados pela tecnologia (confira esse texto para saber mais).

Então vamos neutralizar eles. Há técnicas de processamento de dados e limpeza que poderíamos utilizar.

Bem… essa foi a primeira ideia dos alunos da autora quando confrontados por este problema. Mas se há problemas políticos nos conjuntos de dados, “apolitizar” eles pode não ser a melhor estratégia.

Neutralizar problemas, podem na realidade modificar a interpretação dos dados perante a realidade. Então o ponto é modificar a forma de como se enxerga eles. Deixar de olhar eles apenas como objetos materiais que precisam ser limpos, mas sim como objetos culturais que estão entrelaçados por uma estrutura simbólica de poder.

Para desenvolver isso, ela então introduziu os 3 tipos de leitura:

  • Denotativa
  • Conotativa
  • Desconstrutiva

Leitura Denotativa

A leitura denotativa é a leitura literal dos dados. Aqui deve-se apenas se prender aos que os dados estão dizendo, sem que haja outras interpretações externas.

O posicionamento crítico em relação a esta leitura é a busca de entender literalmente quais são os dados.

É uma visão mais técnica de leitura e os dicionários de dados podem auxiliar a entender melhor eles, através de metadados bem descritos.

Ela alega que é raridade isso ocorrer com dados governamentais, o que não diferencia muito da nossa realidade.

Entender denotativamente os dados é essencial para que possamos partir para outras formas de leitura.

Leitura Conotativa

Ler conotativamente é se aprofundar mais no significado dos dados. Entender o contexto histórico, político e cultural das origens dos dados.

Compreender quais foram as normas, regras e outros conjuntos que estruturaram e influenciaram esses conjuntos de dados é o posicionamento crítico que deve-se buscar ao se realizar uma leitura conotativa.

Buscar na documentação que formaliza a governança e genealogia da coleção destes dados é a fonte de informação que deve-se consultar.

O ponto aqui desta leitura é interpretar o sentido que esses dados possuem, que será essencial para a próxima leitura.

Leitura Desconstrutiva

Após uma leitura literal e interpretativa dos dados, já conseguimos nos contextualizar melhor sobre nosso objeto estudado.

A partir disso conseguimos realizar uma leitura desconstrutiva (crítica) da representação dos dados, assim como na investigação das ausências que os dados trouxeram.

Sim, conjuntos de dados possuem ausências e não são apenas os “NAN” (Not a Number) que encontramos ao realizar a limpeza, mas ausências ainda mais significativas que perpassam pela estrutura de quando foram originados ou de quando foram tratados.

São os vieses gerados (intencionalmente ou não) pelas estruturas de poder que originam eles. O ponto aqui é entender o significado político destes dados.

A documentação de auditorias da limpeza e tratamento dos dados, pode ser a fonte de informação para se apoiar nesta etapa.

Conclusões

A autora deixa bem claro que mesmo havendo uma divisão criada entre os tipos de leitura, eles não são fáceis quando aplicados na prática. As etapas não são lineares e uma pode levar a outra em diferentes momentos.

Mas a leitura de conjunto de dados para se extrair significado real, está além de uma visão técnica.

Trabalhar com dados é uma tarefa sim das áreas exatas, mas também é das humanidades. O conhecimento não é limitado e devemos procurar perspectivas de diferentes ângulos para se conseguir enxergar o todo.

Os conjuntos de dados são objetos que refletem uma estrutura de poder e devemos ter uma visão crítica de acordo com o seu contexto sócio-histórico e cultural.

Agora reflita:

Dos conjuntos de dados que você já analisou, você modificaria suas análises ao praticar essas leituras?

Recomendo fortemente vocês lerem o artigo, desenvolverem suas próprias reflexões e abrirmos para mais discussões.

Se você chegou até aqui e curtiu, dê palmas, compartilhe e se inscreva para me acompanhar.

Ainda há muito a se explorar…

Referências

POIRIER, Lindsay. Reading datasets: Strategies for interpreting the politics of data signification. Big Data & Society, [S. l.], v. 8, n. 2, p.1–19, 2021. DOI: 10.1177/20539517211029322. Disponível em: https://doi.org/10.1177/20539517211029322.

--

--

Francisco Foz

Bibliotecário | Analista de dados | Disseminando informações para produzir conhecimento.