Armazem de dados
Um data warehouse é um sistema no qual os dados são armazenados, organizados e processados para um propósito final.
Portanto, estamos diante de um espaço físico ou virtual no qual informações são coletadas para fins múltiplos. Este espaço permite a organização e consulta dos dados no momento em que o utilizador que aceda o considere oportuno.
Os objetivos variam consoante a entidade proprietária do armazém, uma vez que os objetivos finais de uma empresa, de uma instituição pública ou de uma organização sem fins lucrativos são fundamentalmente diferentes.
Além disso, um data warehouse também é conhecido como banco de dados, que se traduzirmos para o inglês ( data warehouse ) pode nos soar mais familiar em áreas onde a computação está muito presente.
Características de um data warehouse
Um data warehouse é projetado, construído e carregado com dados para uma finalidade específica.
Por esse motivo, um warehouse ou banco de dados precisa de fontes nas quais basear sua entrada de dados, pois um banco de dados não é uma lista de dados, mas precisa continuamente de dados para ser útil de alguma forma.
A título de comparação, não é o mesmo fazer um top 10 dos jogadores de futebol que mais gols marcaram em 2020 do que um dos 10 melhores jogadores de futebol que mais gols marcaram desde o início do futebol até o presente. A primeira é uma lista de dados ordenados que não são atualizados e, para a segunda, é necessária uma base de dados continuamente atualizada com dados e informações.
Assim, para um data warehouse funcionar satisfatoriamente, ele precisa de um software para atualizá-lo e mantê-lo ativo em suas tarefas. Esses softwares geralmente são sistemas especializados de gerenciamento de banco de dados .
Assim, um sistema de gerenciamento especializado em bancos de dados poderá definir os dados, armazená-los e, quando necessário, modificá-los.
Portanto, como resultado disso, podem ser geradas análises, relatórios e mineração de dados que podem ser relevantes para nós. Este aspecto é fundamental porque a obtenção de informações que a priori não podem ser vistas diretamente pode ser vislumbrada através da realização de certas técnicas estatísticas. Um exemplo seria a correlação entre os elementos. Conseguir associar uma correlação corretamente pode ser uma grande vantagem competitiva para qualquer empresa.
Tipos de armazenamento de dados
Os data warehouses podem ser classificados de várias maneiras, pois não há uma classificação formal. No entanto, a tipologia que mais frequentemente é dada é de acordo com os seguintes fatores:
- relacional ou não
- Local ou na nuvem.
- Dinâmico ou estático.
- Orientação a objetos ou não.
Em primeiro lugar, quando nos referimos a serem relacionais ou não, estamos diferenciando se os dados mensuráveis (números ou graus de classificação: 1, 2; alto, médio…) ou não (amor ao seu país, família ou felicidade geral, os quais são dados de um recorte mais qualitativo).
Então, em segundo lugar, um data warehouse pode ser encontrado com servidores na própria sede da empresa ou localizados a milhares de quilômetros de distância.
Em terceiro lugar, se forem dinâmicos, podem incluir novas formas de guardar e classificar os dados ao longo do tempo, enquanto nos estáticos o modelo predefinido não é alterável.
Quarto e último, temos que definir quando um armazenamento de dados é orientado a objetos ou não. Por um lado, é orientado a objetos quando um conjunto de dados define uma entidade superior, que tem como características os dados a ela associados. Por outro lado, ao lidar com dados que por si só já possuem uma utilidade e uma razão de ser, diz-se que não é orientado a objetos.
Exemplo de armazenamento de dados
Para utilizar satisfatoriamente um data warehouse, assumimos que um não digital (papel e caneta) não é eficiente quando comparado com o desempenho de suas versões adaptadas digitalmente.
Por isso, alguns softwares especializados nesse tipo de tarefa são:
- Oráculo.
- Sybase (SAP).
- MySQL.
- Acesso MSO (Microsoft).
- DB2 IBM.
Estes programas são os que, na prática, armazenam os dados de uma empresa ou instituição pública, como a Inditex sobre questões relacionadas com big data nas vendas, número de visitas ao seu website, etc.; ou numa instituição como o Instituto Nacional de Estatística (INE), que guardará todo o tipo de dados ao nível nacional ou regional das exportações, PIB ou rendimentos, entre outros.
Em suma, como referido anteriormente, a chave de um warehouse ou base de dados é o tratamento de dados para uma finalidade específica, que dependerá da entidade ou empresa que o gere.