Articles / november 24, 2021

Data Vault – en oversigt

Data Vault er en innovativ datamodelleringsmetode til store datawarehouse-platforme. Data Vault er opfundet af Dan Linstedt og er designet til at levere et Enterprise Data Warehouse, samtidig med at ulemperne ved de normaliserede (3. normalform) og dimensionelle modelleringsteknikker håndteres. Den kombinerer det centraliserede rådataregister i Inmon-tilgangen med de inkrementelle opbygningsfordele i Kimball.

Denne artikel opsummerer ulemperne ved 3NF- og Dimensional Design-tilgangen og opregner fordele og ulemper ved Data Vault-tilgangen. Endelig indeholder den links til noget nyttig baggrundslæsning og har til formål at besvare spørgsmålet:

Bør jeg bruge Data Vault på mit Data Warehouse-projekt?

Hvilket problem forsøger Data Vault at løse?

Hvor vi opsummerer de udfordringer, som Data Vault forsøger at løse, er det værd at overveje den alternative datamodelleringstilgang og de tilsvarende dataarkitekturer. Nedenstående diagram viser en potentiel Enterprise Data Architecture.

Enterprise Data Warehouse

Med EDW-tilgangen indlæses data i et transient Landing Area, hvorefter der anvendes en række ETL-processer til at indlæse data i et 3rd Normal form enterprise data warehouse. Dataene udtrækkes efterfølgende i dimensionelle datamarts til analyse og rapportering.

De væsentligste ulemper ved denne tilgang omfatter:

Time to Market: Enterprise Data Warehouse skal først integrere data fra hvert af kildesystemerne i et centralt dataregister, før de er tilgængelige til rapportering, hvilket øger projektets tid og indsats.
Kompleksitet og færdigheder: Et datawarehouse skal måske integrere data fra hundrede kilder, og design af en virksomhedsdækkende datamodel til understøttelse af et komplekst forretningsmiljø er en betydelig udfordring, der kræver højt kvalificerede datamodelleringseksperter.
Manglende fleksibilitet: En tredje normalformsmodel har en tendens til at modellere de eksisterende datarelationer, hvilket kan give en relativt ufleksibel løsning, der kræver betydelig omarbejdning, når der tilføjes yderligere kilder. Endnu værre er det, at overivrige datamodelleringseksperter ofte forsøger at overvinde dette ved at levere overkomplekse generiske modeller, som er næsten umulige at forstå.

Dimensionel designtilgang

Diagrammet nedenfor illustrerer en potentiel dataarkitektur for et klassisk dimensionelt datawarehouse-design.

Universe

Data Vault – en oversigt

Hvilket problem forsøger Data Vault at løse?

Data Vault Fordele

Ulemperne ved Data Vault

Hvor skal Data Vault bruges?

Andre ressourcer og værktøjer

Konklusion

Leave a Reply Cancel