Realizar busca
test

Data warehouse: o que é, para que serve e como funciona

O “armazém de dados” é um repositório central cujo objetivo é permitir que as empresas analisem, com agilidade, grande volume de dados e extraiam valor dessas informações

O “armazém de dados” é um repositório central cujo objetivo é permitir que as empresas analisem grande volume de dados e extraiam valor dessas informações

 

Bruno Toranzo

 

Internet Archive é uma organização sem fins lucrativos por trás de uma iniciativa chamada Wayback Machine, que coleta e armazena os arquivos da internet. O conteúdo armazenado nessa espécie de “backup da web” é tão fabuloso que, recentemente, atingiu a marca de 100 petabytes. Para ter uma dimensão de quanto isso representa, 1,5 petabyte corresponde a 10 bilhões de fotos no Facebook, e 20 petabytes equivalem a todos os textos da Biblioteca do Congresso dos Estados Unidos.

O destaque do Internet Archive são os 741 bilhões de páginas da web, que, no entanto, respondem por apenas uma parte dos 100 petabytes armazenados. Esse volume impressionante de dados também é encontrado nas empresas, motivo pelo qual tem ganhado cada vez mais relevância o conceito de data warehouse, um sistema que integra ou organiza todas essas informações.

Os dados dominam a sociedade de hoje e devem ser utilizados pelas empresas para fornecer inteligência de negócio. A capacidade das organizações de se diferenciarem passa, portanto, pela utilização estratégica dos dados no dia a dia. O data warehouse faz parte da transformação digital que o mundo está vivendo e é fundamental para as empresas se manterem competitivas.

 

LEIA TAMBÉM:

• Alfabetização em dados é competência essencial para qualquer profissão

 

O que é um data warehouse?

Trata-se basicamente de um repositório central de informações que permite às organizações, a partir da análise desses dados, tomar decisões mais adequadas ao momento do negócio. As empresas podem usar o data warehouse para combinar informações pertinentes sobre seus clientes, como e-mail de contato, interações e compras realizadas.

Os dados do data warehouse são provenientes de diversas fontes, como sistemas transacionais e arquivos de log de aplicativos. Os apps, aliás, são cada vez mais utilizados para relacionamento com o consumidor. O data warehouse armazena dados estruturados, como tabelas de banco de dados e planilhas do Excel, e dados semiestruturados, como arquivos XML e páginas da web.

 

Para que serve um data warehouse?

O propósito do data warehouse, como o próprio nome sugere (armazém de dados, na tradução para o português) é centralizar enormes volumes de dados advindos de várias fontes. Esse sistema é criado para dar suporte às atividades de Business Intelligence (BI). Está projetado para analisar os dados, o que significa fazer a leitura correta dessas informações para compreender relações e tendências voltadas para o negócio.

 

LEIA TAMBÉM:

• Como viabilizar uma organização orientada a dados

 

Como é feito um data warehouse?

O data warehouse é feito de diferentes camadas. A camada superior disponibiliza os resultados por meio de relatórios, análises e mineração de dados. A camada intermediária oferece o mecanismo de análise, usado para acessar e analisar os dados. Já a camada inferior constitui o servidor de banco de dados, local de carregamento e armazenamento dos dados.

De forma geral, o data warehouse é criado com os seguintes elementos:

– Banco de dados relacional;

– Solução de extração, carregamento e transformação para viabilizar a análise dos dados;

– Análise estatística, relatórios e mineração de dados;

– Ferramentas de análise para visualizar e apresentar dados aos usuários;

– Outras aplicações analíticas que geram informações por meio de ciência de dados e algoritmos de Inteligência Artificial.

 

LEIA TAMBÉM:

• Dados ou boas perguntas: qual é o petróleo do século 21?

 

Quais são os benefícios do data warehouse?

O benefício principal do data warehouse é permitir às empresas analisar, com agilidade, grande volume de dados e extrair valor dessa análise. Também possibilita manter um registro histórico, o que se mostra indispensável na análise de dados ao longo dos meses ou dos anos.

Para o cientista de computação americano William Inmon, tido como o “pai do data warehouse”, esse benefício é possível por causa de quatro fatores. O primeiro é a orientação do data warehouse para o assunto. Isso significa que ele pode analisar dados sobre um determinado assunto ou área funcional. É a melhor forma de identificar um assunto na imensidão dos dados.

O segundo fator é a integração, permitindo que o data warehouse crie consistência entre diferentes tipos de dados provenientes de fontes distintas. Não há como fazer análise sem que os dados estejam reunidos em apenas um lugar.

O terceiro é a sua não volatilidade, ou seja, quando os dados estão no data warehouse, eles não mudam. Essa estabilidade possibilita análise mais precisa.

Por fim, o data warehouse considera variáveis de acordo com o tempo — são aquelas mudanças próprias do passar do tempo, que podem ocorrer devido a uma alteração da estrutura da empresa ou do modelo de negócios.

Há, também, a garantia da proteção dos dados em ambiente privado e seguro. O custo anual dos crimes cibernéticos, de acordo com a empresa de inteligência de mercado Statista, crescerá 40%, chegando a 11,5 trilhões de dólares em 2023. Ainda segundo esse estudo, o cibercrime causará danos no valor de 8,44 trilhões de dólares neste ano — aumento de 630% em relação a 2019. Se fosse um país, considerando o PIB como referência, o cibercrime ocuparia a terceira posição entre as maiores economias do mundo, atrás apenas dos Estados Unidos e da China.

Este website usa Cookies

Saiba como o Insper trata os seus dados pessoais em nosso Aviso de Privacidade, disponível no Portal da Privacidade.

Aviso de Privacidade

Definições Cookies

Uso de Cookies

Saiba como o Insper trata os seus dados pessoais em nosso Aviso de Privacidade, disponível no Portal da Privacidade.

Aviso de Privacidade