A quantidade de dados gerados no mundo cresce de forma exponencial. Em 2025, a estimativa é que serão 175 trilhões de gigabytes de dados, quase três vezes o volume atual
Bernardo Vianna
Os dados do Censo de 1940, realizado pelo então Serviço Nacional de Recenseamento, foram registrados em cartões perfurados, a tecnologia disponível à época para isso. O armazenamento desses cartões ocupava grande volume e era preciso transportá-los fisicamente até máquinas especializadas para que pudéssemos acessar os dados neles registrados.
Daquela época até os dias de hoje, enquanto a população brasileira crescia de cerca de 40 milhões para mais de 200 milhões de pessoas, a capacidade de armazenamento desses dados se desenvolveu desde os cartões de papel, passando por mídias magnéticas e ópticas até os semicondutores dos discos de estado sólido mais recentes. Da mesma forma, a disponibilidade de acesso a esses dados também mudou radicalmente. Hoje, qualquer pessoa pode consultar os dados demográficos do IBGE e pode facilmente utilizá-los para desenvolver suas próprias aplicações por meio de chamadas à sua API.
Diante da pandemia, ao longo dos últimos dois anos, ficou evidente a importância desse desenvolvimento enquanto olhávamos, por vezes com horror, por outras com esperança, para os painéis de casos de covid. Ainda agora, já próximos da reabertura, nos guiamos pelo produto final do processo de produção, armazenamento, análise e transmissão de dados digitais.
Quantidade de bits será maior que a de átomos no planeta
Todas as nossas interações digitais geram dados. A quantidade de dados que o mundo produz, além daqueles criados e consumidos para guiar políticas públicas, inclui compras, vendas, transações bancárias, 500 milhões de tweets, 294 bilhões de e-mails, 4 milhões de gigabytes de dados de interações no Facebook, 65 bilhões de mensagens no WhatsApp e 720 mil horas de conteúdo novo adicionado ao YouTube.
De acordo com o relatório Data Age 2025, do IDC, a quantidade de dados criada, capturada, copiada e consumida em 2018 foi de 33 zettabytes, ou 33 trilhões de gigabytes. Esse número cresceu, em 2020, para 59 ZB e é esperado que atinja 175 ZB até 2025 — ou 175.000.000.000.000 gigabytes.
Para colocar esse número em perspectiva, considere que cada byte equivale a 8 bits e que cada bit corresponde à quantidade de informação contida em um caractere. Um estudo da Universidade de Portsmouth estima que em 350 anos teremos produzido uma quantidade de bits maior que o número de átomos existentes no planeta Terra.
Mas nem tudo é aproveitado
Nem todos os dados gerados por nossas interações digitais são capturados e estão estruturados e disponíveis para uso. De acordo com o Seagate Rethink Data Survey, realizado pelo IDC em 2020, quase metade dos dados gerados pelas operações das empresas consultadas para a pesquisa não era capturada naquele ano. Por sua vez, entre os dados capturados, pouco mais da metade é de fato utilizada para análises dos negócios.

A mesma pesquisa também enumera os desafios que limitam a captura e o aproveitamento dos dados pelos negócios: garantir a coleta dos dados necessários, gerenciar o armazenamento dos dados coletados, garantir a segurança desses dados, estruturá-los para que possam ser utilizados e, finalmente, fazer com que os diferentes locais de armazenamento estejam disponíveis. Eis aí um amplo campo de atuação e inovação para os futuros cientistas e engenheiros da computação.
