IGTI Blog
Data Warehouse

A importância do Data Warehouse em um projeto de BI

A modelagem dimensional é a técnica utilizada para se ter uma visão multidimensional dos dados e não uma visão simplista. A construção de um Data Warehouse é fundamental em um projeto de BI, promovendo a tomada de decisão e a análise estratégica das informações.

A teoria de banco de dados foi difundida e está disponível há alguns anos. Nesta teoria os dados são armazenados com o propósito principal de realizar operações transacionais, sejam em tempo real, sejam em um intervalo de tempo programado. Mas também são utilizados, em menor frequência, para a execução de processos analíticos.

Neste contexto, o conceito de Data Warehouse (DW – armazém de dados) surgiu no início da década de 80 quando os sistemas gerenciadores de banco de dados (SGBD) apareceram como facilitadores da computação de dados, e, consequentemente, facilitadores para a tomada de decisão.  Alguns autores dizem que Bill Inmon é o “pai do Data Warehouse”, isto pelo fato dele ter observado que os dados poderiam ser organizados em um ativo corporativo que o mesmo nomeou de Data Warehouse.

DW é uma coleção de dados orientada por assuntos, integrada, variante ao tempo, e não volátil, que tem por objetivo dar suporte aos processos de tomada de decisão.

  •         Orientado por assunto: a primeira característica do DW é que ela é orientada em torno dos grandes assuntos da empresa.
  •      Integrado: os dados encontrados dentro do armazém de dados serão sempre, sem possibilidades de exceção, integrados.
  •      Não volátil:  modificações nos dados já existentes não ocorrem no DW.
  •      Variante no tempo: os dados no Data Warehouse podem ser apresentados em tempos determinados.

Os dados disponíveis nos DW poderão ser acessados pelos gerentes, analistas e usuários finais, possibilitando a realização de várias tarefas, tais como processamento analítico (OLAP) ou inteligência empresarial (BI – Business Intelligence). O BI é um termo abrangente, que constitui o conjunto de ferramentas voltadas para a tomada de decisão organizacional.

Outra característica importante é que o DW armazena o acúmulo de dados históricos, pois pode conter dados por muitos anos, com tamanho de armazenamento muito grande. Normalmente, depois de completadas as transações comerciais na aplicação ou no armazenamento de dados operacionais, elas são transferidas para o DW (processo de ETL – extração, transformação e carga). Também pode-se estabelecer uma periodicidade adequada para esta transferência dos dados.

Nesta perspectiva, para o funcionamento pleno de um projeto de BI, os dados brutos operacionais, mantidos nos bancos de dados corporativos, espalhados por vários sistemas da organização e em fontes heterogêneas, são colocados em um DW por meio do processo de ETL.

O DW é, portanto, um componente central de uma infraestrutura de BI e funciona como um repositório, ou seja, um armazém de análise de informações numéricas estáveis e verificáveis. Este banco de dados (o DW) trabalha com tabelas denominadas Fato e Dimensão. Os Fatos armazenam valores detalhados de medidas, e as tabelas de Dimensão armazenam os membros e atributos.

Vimos então que o BI possui grandes componentes, como o DW, que é a fonte de dados, assim como a análise de negócios, formada por uma coleção de ferramentas para manipular e analisar os dados do DW. Assim sendo, usando as ferramentas de inteligência nos negócios podem ser feitas consultas, relatórios diversos, ou quaisquer outras análises, como gráficos, relatórios e dashboards.

Concluindo: ao modelarmos corretamente um DW estaremos dando um passo adiante ao mundo transacional (dos sistemas de gestão das empresas), em que as respostas que envolvem os dados não atendem a maioria das organizações. A estrutura do DW está em evolução, e pode ser considerada como uma resposta à complexidade dos ambientes organizacionais e à dificuldade de integrar todos os dados heterogêneos.

Professor autor: Fernando Zaidan