[{"jcr:title":"Data warehouse: o que é, para que serve e como funciona"},{"targetId":"id-share-1","text":"Confira mais em:","tooltipText":"Link copiado com sucesso."},{"jcr:title":"Data warehouse: o que é, para que serve e como funciona","jcr:description":"O “armazém de dados” é um repositório central cujo objetivo é permitir que as empresas analisem, com agilidade, grande volume de dados e extraiam valor dessas informações"},{"subtitle":"O “armazém de dados” é um repositório central cujo objetivo é permitir que as empresas analisem, com agilidade, grande volume de dados e extraiam valor dessas informações","author":"Ernesto Yoshida","title":"Data warehouse: o que é, para que serve e como funciona","content":"O “armazém de dados” é um repositório central cujo objetivo é permitir que as empresas analisem grande volume de dados e extraiam valor dessas informações   Bruno Toranzo   Internet Archive é uma organização sem fins lucrativos por trás de uma iniciativa chamada Wayback Machine, que coleta e armazena os arquivos da internet. O conteúdo armazenado nessa espécie de “backup da web” é tão fabuloso que, recentemente, atingiu a marca de 100 petabytes. Para ter uma dimensão de quanto isso representa, 1,5 petabyte corresponde a 10 bilhões de fotos no Facebook, e 20 petabytes equivalem a todos os textos da Biblioteca do Congresso dos Estados Unidos. O destaque do Internet Archive são os 741 bilhões de páginas da web, que, no entanto, respondem por apenas uma parte dos 100 petabytes armazenados. Esse volume impressionante de dados também é encontrado nas empresas, motivo pelo qual tem ganhado cada vez mais relevância o conceito de data warehouse, um sistema que integra ou organiza todas essas informações. Os dados dominam a sociedade de hoje e devem ser utilizados pelas empresas para fornecer inteligência de negócio. A capacidade das organizações de se diferenciarem passa, portanto, pela utilização estratégica dos dados no dia a dia. O data warehouse faz parte da transformação digital que o mundo está vivendo e é fundamental para as empresas se manterem competitivas.   LEIA TAMBÉM: [ • Alfabetização em dados é competência essencial para qualquer profissão ](https://www.insper.edu.br/noticias/alfabetizacao-em-dados-e-competencia-essencial-para-qualquer-profissao/)   O que é um data warehouse? Trata-se basicamente de um repositório central de informações que permite às organizações, a partir da análise desses dados, tomar decisões mais adequadas ao momento do negócio. As empresas podem usar o data warehouse para combinar informações pertinentes sobre seus clientes, como e-mail de contato, interações e compras realizadas. Os dados do data warehouse são provenientes de diversas fontes, como sistemas transacionais e arquivos de log de aplicativos. Os apps, aliás, são cada vez mais utilizados para relacionamento com o consumidor. O data warehouse armazena dados estruturados, como tabelas de banco de dados e planilhas do Excel, e dados semiestruturados, como arquivos XML e páginas da web.   Para que serve um data warehouse? O propósito do data warehouse, como o próprio nome sugere (armazém de dados, na tradução para o português) é centralizar enormes volumes de dados advindos de várias fontes. Esse sistema é criado para dar suporte às atividades de Business Intelligence (BI). Está projetado para analisar os dados, o que significa fazer a leitura correta dessas informações para compreender relações e tendências voltadas para o negócio.   LEIA TAMBÉM: [• Como viabilizar uma organização orientada a dados](https://www.insper.edu.br/noticias/como-viabilizar-uma-organizacao-orientada-a-dados/)   Como é feito um data warehouse? O data warehouse é feito de diferentes camadas. A camada superior disponibiliza os resultados por meio de relatórios, análises e mineração de dados. A camada intermediária oferece o mecanismo de análise, usado para acessar e analisar os dados. Já a camada inferior constitui o servidor de banco de dados, local de carregamento e armazenamento dos dados. De forma geral, o data warehouse é criado com os seguintes elementos: – Banco de dados relacional; – Solução de extração, carregamento e transformação para viabilizar a análise dos dados; – Análise estatística, relatórios e mineração de dados; – Ferramentas de análise para visualizar e apresentar dados aos usuários; – Outras aplicações analíticas que geram informações por meio de ciência de dados e algoritmos de Inteligência Artificial.   LEIA TAMBÉM: [• Dados ou boas perguntas: qual é o petróleo do século 21?](https://www.insper.edu.br/noticias/dados-ou-boas-perguntas-qual-e-o-petroleo-do-seculo-21/)   Quais são os benefícios do data warehouse? O benefício principal do data warehouse é permitir às empresas analisar, com agilidade, grande volume de dados e extrair valor dessa análise. Também possibilita manter um registro histórico, o que se mostra indispensável na análise de dados ao longo dos meses ou dos anos. Para o cientista de computação americano William Inmon, tido como o “pai do data warehouse”, esse benefício é possível por causa de quatro fatores. O primeiro é a orientação do data warehouse para o assunto. Isso significa que ele pode analisar dados sobre um determinado assunto ou área funcional. É a melhor forma de identificar um assunto na imensidão dos dados. O segundo fator é a integração, permitindo que o data warehouse crie consistência entre diferentes tipos de dados provenientes de fontes distintas. Não há como fazer análise sem que os dados estejam reunidos em apenas um lugar. O terceiro é a sua não volatilidade, ou seja, quando os dados estão no data warehouse, eles não mudam. Essa estabilidade possibilita análise mais precisa. Por fim, o data warehouse considera variáveis de acordo com o tempo — são aquelas mudanças próprias do passar do tempo, que podem ocorrer devido a uma alteração da estrutura da empresa ou do modelo de negócios. Há, também, a garantia da proteção dos dados em ambiente privado e seguro. O custo anual dos crimes cibernéticos, de acordo com a empresa de inteligência de mercado Statista, crescerá 40%, chegando a 11,5 trilhões de dólares em 2023. Ainda segundo esse estudo, o cibercrime causará danos no valor de 8,44 trilhões de dólares neste ano — aumento de 630% em relação a 2019. Se fosse um país, considerando o PIB como referência, o cibercrime ocuparia a terceira posição entre as maiores economias do mundo, atrás apenas dos Estados Unidos e da China."}]