[{"jcr:title":"O mar de dados virou um oceano e não para de crescer. Mas nem tudo é aproveitado"},{"targetId":"id-share-1","text":"Confira mais em:","tooltipText":"Link copiado com sucesso."},{"jcr:title":"O mar de dados virou um oceano e não para de crescer. Mas nem tudo é aproveitado","jcr:description":"A quantidade de dados gerados no mundo cresce de forma exponencial. Em 2025, a estimativa é que serão 175 trilhões de gigabytes de dados, quase três vezes o volume atual"},{"subtitle":"A quantidade de dados gerados no mundo cresce de forma exponencial. Em 2025, a estimativa é que serão 175 trilhões de gigabytes de dados, quase três vezes o volume atual","author":"Ernesto Yoshida","title":"O mar de dados virou um oceano e não para de crescer. Mas nem tudo é aproveitado","content":"A quantidade de dados gerados no mundo cresce de forma exponencial. Em 2025, a estimativa é que serão 175 trilhões de gigabytes de dados, quase três vezes o volume atual   Bernardo Vianna   Os dados do Censo de 1940, realizado pelo então Serviço Nacional de Recenseamento, foram registrados em cartões perfurados, a tecnologia disponível à época para isso. O armazenamento desses cartões ocupava grande volume e era preciso transportá-los fisicamente até máquinas especializadas para que pudéssemos acessar os dados neles registrados. Daquela época até os dias de hoje, enquanto a população brasileira crescia de cerca de 40 milhões para mais de 200 milhões de pessoas, a capacidade de armazenamento desses dados se desenvolveu desde os cartões de papel, passando por mídias magnéticas e ópticas até os semicondutores dos discos de estado sólido mais recentes. Da mesma forma, a disponibilidade de acesso a esses dados também mudou radicalmente. Hoje, qualquer pessoa pode consultar os dados demográficos do IBGE e pode facilmente utilizá-los para desenvolver suas próprias aplicações por meio de [chamadas à sua API](https://servicodados.ibge.gov.br/api/docs/pesquisas) . Diante da pandemia, ao longo dos últimos dois anos, ficou evidente a importância desse desenvolvimento enquanto olhávamos, por vezes com horror, por outras com esperança, para os [painéis de casos](https://coronavirus.jhu.edu/map.html)  de covid. Ainda agora, já próximos da reabertura, nos guiamos pelo produto final do processo de produção, armazenamento, análise e transmissão de dados digitais. Quantidade de bits será maior que a de átomos no planeta Todas as nossas interações digitais geram dados. A quantidade de dados que o mundo produz, além daqueles criados e consumidos para guiar políticas públicas, inclui compras, vendas, transações bancárias, 500 milhões de tweets, 294 bilhões de e-mails, 4 milhões de gigabytes de dados de interações no Facebook, 65 bilhões de mensagens no WhatsApp e 720 mil horas de conteúdo novo adicionado ao YouTube. De acordo com o relatório [Data Age 2025, do IDC](https://www.datanami.com/2018/11/27/global-datasphere-to-hit-175-zettabytes-by-2025-idc-says/) , a quantidade de dados criada, capturada, copiada e consumida em 2018 foi de 33 zettabytes, ou 33 trilhões de gigabytes. Esse número cresceu, em 2020, para 59 ZB e é esperado que atinja 175 ZB até 2025 — ou 175.000.000.000.000 gigabytes.   Para colocar esse número em perspectiva, considere que cada byte equivale a 8 bits e que cada bit corresponde à quantidade de informação contida em um caractere. Um [estudo da Universidade de Portsmouth](https://aip.scitation.org/doi/abs/10.1063/5.0019941) estima que em 350 anos teremos produzido uma quantidade de bits maior que o número de átomos existentes no planeta Terra. Mas nem tudo é aproveitado Nem todos os dados gerados por nossas interações digitais são capturados e estão estruturados e disponíveis para uso. De acordo com o [Seagate Rethink Data Survey](https://www.seagate.com/br/pt/our-story/rethink-data/) , realizado pelo IDC em 2020, quase metade dos dados gerados pelas operações das empresas consultadas para a pesquisa não era capturada naquele ano. Por sua vez, entre os dados capturados, pouco mais da metade é de fato utilizada para análises dos negócios. A mesma pesquisa também enumera os desafios que limitam a captura e o aproveitamento dos dados pelos negócios: garantir a coleta dos dados necessários, gerenciar o armazenamento dos dados coletados, garantir a segurança desses dados, estruturá-los para que possam ser utilizados e, finalmente, fazer com que os diferentes locais de armazenamento estejam disponíveis. Eis aí um amplo campo de atuação e inovação para os futuros cientistas e engenheiros da computação.  "}]