A tradução ao pé da letra de data warehouse, “depósito de dados”, ajuda bastante a começar a entender o que é e para que serve esse recurso, essencial para quem pretende desenvolver estratégias de Business Intelligence, mais conhecida como BI.

É nesse armazém de dados digitais que empresas e outras organizações acumulam informações detalhadas e sistematizadas, que dão origem a relatórios capazes de apoiar a tomada de decisões. O bom uso do data warehouse pode ajudar no controle de processos, por meio da disponibilização de informações estratégicas.

A estrutura do data warehouse permite a unificação dos sistemas para ter uma base única para a montagem dos relatórios, o que, inclusive, possibilita a aplicação data mining (mineração de dados) nesse depósito de informações.

Como se monta um data warehouse?

Um sistema de data warehouse precisa de algumas estruturas para poder funcionar e cumprir a sua função de manter, organizar e qualificar os dados de uma empresa. O primeiro deles é a fonte de dados, isto é, os sistemas que originam as informações, também conhecidos como sistemas transacionais.

Informações de vendas, de almoxarifado, pagamentos, ponto dos funcionários — tudo o que gera dados passíveis de análise e que podem ser usados nas definições estratégicas e na melhoria do desempenhodeve ser incluído no data warehouse.

Essas informações, depois de imputadas, passam pela fase do data stage, que é responsável por extrair os dados a partir dos sistemas transacionais, cuidar da sua limpeza e prepará-los para serem usados no data warehouse. Esses dados não são apresentados ao usuário final.

O próximo passo se dá no servidor de apresentação, fase em que os dados são tratados e armazenados para estarem disponíveis à consulta pelo usuário final. Para isso, costumam ser utilizadas ferramentas, como bancos de dados relacionais ou de tecnologia OLAP (OnLine Analytical Processing).

Além das etapas descritas acima, os data warehouses contam com sistemas de apoio, como os usados para a organização das informações e relatórios (data mart) e de buscas em grandes massas de dados(data mining).

Quais as vantagens de se ter um data warehouse?

1. Dados centralizados

Ter seus dados centralizados é a primeira grande vantagem proporcionada pelos data warehouses. Isso significa muito mais agilidade na hora de buscar e usar dados. A isso, soma-se a eliminação de inconsistências nas informações, que são solucionadas antes mesmo do carregamento dos dados.

2. Tomadas de decisão

A qualidade da informação, obtida nos processos anteriores, resulta em uma melhor tomada de decisão, pois, por meio dela, é possível gerar relatórios de naturezas variadas (tendências, de exceção, metas versus desempenho) que vão embasar as decisões.

3. Visão ampla

Outro atrativo dos data warehouses é possibilitar uma visão mais ampla do conjunto de informações, eliminando imprecisões e complexidades desnecessárias. Ao analisar dados obtidos em um intervalo maior de tempo, é possível obter leituras históricas, que apontam tendências e colaboram para o planejamento de médio e longo prazo, assim como as decisões mais imediatas.

Neste texto, explicamos o que são data warehouses, como funcionam e quais as suas vantagens para as empresas. Se você se interessou e quer se aprofundar um pouco mais no assunto, que tal dar uma olhada em outro texto sobre o tema que também está no nosso blog? Vamos lá!

Leandro Guimarães
Leandro Guimarães
Leandro Guimarães é o fundador da Know Solutions e trabalha com Business Intelligence desde 2009. Possui amplo conhecimento em Modelagem Dimensional, Data Warehouse e na plataforma Pentaho.

Foi aluno de Ralph Kimball, maior referência mundial no assunto, no curso de Modelagem Dimensional realizado pela Kimball University, em Estocolmo – Suécia.

Já ministrou diversas palestras sobre o tema e atualmente mantêm o blog da Know Solutions, com referências sobre Business Intelligence.

Pós Graduado em Gestão de Projetos de Software pela PUC – Paraná. Trabalhou durante 7 anos na empresa Siemens onde participou de projetos em diferentes países.