Photo by @Annie Spratt on Unsplash

O que é “Data infrastructure literacy” e qual a sua importância ?

Francisco Foz

--

Data literacy, literacia de dados, letramento de dados, alfabetização de dados... muitos termos um conceito:

“(…) capacidade de pesquisar, agregar e correlacionar grandes quantidades de dados a partir de computadores e redes.” (KOLTAY, 2015 apud OLIVEIRA; REIS; MOURA; GOMES, 2017)

Ou seja, saber utilizar ferramentas tecnológicas para se extrair informações de dados.

O letramento de dados é muito amplo e está sendo utilizado em diversos setores: na indústria, na educação, no meio acadêmico…

Esse conceito/prática está cada vez mais presente devido a novos paradigmas como o Data Mesh (no qual já escrevi sobre aqui) onde a estrutura se torna descentralizada e o “self-service data” se consolida. Assim como na própria democratização de dados (confira esse texto de como a Hotmart democratizou os dados em 2020).

Mas… além da competência técnica há a necessidade do entendimento sociotécnico (aí entra a parte da infraestrutura).

Entender o contexto dos dados é a chave para melhores práticas e entrega de valor nas organizações.

Neste texto abordarei o conteúdo deste artigo científico:

“Data infrastructure literacy”

Gray, J., Gerlitz, C., & Bounegru, L. (2018). Data infrastructure literacy. Big Data & Society. https://doi.org/10.1177/2053951718786316

Publicado em 2018 mas com reflexões muito interessantes e atuais.

Bora lá?!

Sumário

Refletindo sobre a alfabetização de dados

Desconstruindo a infraestrutura de dados

Reconstruindo a infraestrutura de dados

Referências

Refletindo sobre a alfabetização de dados

Há anos o uso dos dados para se extrair valor, seja ele econômico, social, tecnológico, político… é o assunto quente do momento.

E sim ! Isso é essencial e muito importante.

Saber usar esses dados como recurso, como matéria é o papel da alfabetização de dados.

Mas eles não são só isso.

Por detrás destes “produtos” há uma:

Relação social

Relação política

Relação cultural

no qual se originaram.

Entender, criticar, intervir e criar esse contexto por e para um público que gera, utiliza e também compartilha dados é o alvo da Alfabetização da Infraestrutura de Dados (ou “Data Infraestructure Literacy” se preferir).

Por que? Ter o dado pronto, limpo, organizado não é o bastante?

Está pronto para quem? Foi limpo por quem? Organizado para o quê?

Os conjuntos de dados por si só já são enviesados (veja a quantidade de estudos sobre o tema, em uma pesquisa simples no Google acadêmico aqui).

O aspecto ético na inteligência artificial já há alguns anos nos mostra a complexidade que é trabalhar com dados.

Problematizar o contexto de como foram coletados será muito relevante lá na frente quando eles forem manipulados por cientistas de dados para passarem por uma IA e gerarem novos conjuntos de dados. Conjuntos que serão produtos em outros sistemas e gerarão novos dados visualizados por dashboards voltados à tomada de decisão.

Ou problematizar do porque não houve coleta.

Por isso a importância de se entender e promover esse entendimento da infraestrutura.

De acordo com o texto:

“(…) muitos estudos sociais de dados apontaram, os dados nunca são “brutos” no sentido epistemológico de oferecer acesso transparente, auto-evidente e não mediado aos fenômenos.”

Até mesmo dados mais “puros” e “brutos” como os dados de pesquisa observacionais, terão um contexto histórico e uma especificidade no tipo de tecnologia que coletou.

Desconstruindo a infraestrutura de dados

A infraestrutura dos dados é social e os autores exemplificaram isso através da perspectiva dos dados abertos das rede sociais e do seus públicos.

PESSOAS → RELAÇÕES →DADOS → RELAÇÕES →DADOS →PESSOAS

Dados Abertos

Já há algum tempo os países tem divulgados seus dados em plataformas especializadas para a população.

Mas se os dados disponibilizados e divulgados não responderem as necessidades de todos os públicos. Se originam iniciativas como a Operação Serenata de Amor que trazem a superfície uma outra perspectiva sobre.

Infraestruturas de dados em redes sociais

A infraestrutura dos dados de redes sociais são originadas dentro do padrão delas, que por este motivo sofrem do viés metodológico.

No Twitter, apenas damos um like, no Facebook hoje já são diversos emojis, no Linkedin a mesma coisa.

Mas e quando você não gosta?

E os emojis que são irônicos?

E o próprio Discord que permite você colocar diversos tipos bem criativos e semânticos, como esse:

São aspectos, práticas culturais e sociais que devem ser entendidas em conjunto para se agregar mais valor.

Os diferentes públicos da infraestrutura de dados

A população, os hackers cívicos os jornalistas de dados, os políticos, os profissionais de marketing…

São públicos que se entrelaçam através do papel de criador e consumidor de dados.

Reconstruindo a infraestrutura de dados

Muito além das competências de extrair informações de conjuntos de dados, a capacidade de explicar, criticar e intervir em respostas para as infraestruturas de dados é uma habilidade que atualmente ainda é pouco trabalhada.

Mas e como gerar essas iniciativas?

Os autores indicaram incluir esse aprofundamento sobre os dados em universidades, escolas e treinamentos.

Sugeriram que houvessem iniciativas públicas para não apenas gerar dados, análises ou visualizações, mas sim como um local de participação e colaboração em comunidades mais ativas.

Em resumo, o papel da Alfabetização da Infraestrutura de Dados é dar mais voz ao coletivo para que os os indivíduos possam contribuir e aprender com as diversas perspectivas de se enxergar, analisar e organizar o mundo com ou mesmo sem dados.

Agora me diga, qual a sua visão sobre a alfabetização da infraestrutura de dados? Compartilhe nos comentários.

Se você chegou até aqui e curtiu, dê palmas, compartilhe e se inscreva para me acompanhar.

Ainda há muito a se explorar…

Referências

OLIVEIRA, F. R.; REIS, F. MOURA, S. C. da; GOMES, S. Letramento informacional em cenários de controle de luxos de informacionais. In: Simpósio Nacional da ABCiber, 10, 2017, São Paulo. Anais […]. São Paulo: USP, 2017. p. 1805–1818. Disponível em: https://www.researchgate.net/profile/Frederico-Oliveira-13/publication/326866595_Letramento_informacional_em_cenarios_de_controle_de_fluxos_informacionais/links/5b698b83299bf14c6d9507c4/Letramento-informacional-em-cenarios-de-controle-de-fluxos-informacionais.pdf.

--

--

Francisco Foz
Francisco Foz

Written by Francisco Foz

Bibliotecário | Analista de dados | Disseminando informações para produzir conhecimento.

No responses yet