Benutzer:A. Liskes/Data Vault Modeling

aus Wikipedia, der freien Enzyklopädie
Zur Navigation springen Zur Suche springen

Übersetzung des englischen Artikels: Data Vault Modeling

Bei der Modellierung von Data-Warehouse-Systemen gibt es zwei häufig verwendete Möglichkeiten, die Speicherschicht (Operational Data Store kurz ODS) zu definieren. Entweder man verwendet die Methode nach Ralph Kimball mit Conformed Dimensions oder die Methode nach Bill Inmon mit der Datenbank in 3. Normalform. Beide Techniken haben Schwächen wenn sich Datenquellen ändern, aus denen sich die Speicherschicht zusammensetzt. Bei Conformed Dimensions müssen die Eingangsdaten auch noch aufgeteilt und bereinigt werden (Datenbereinigung). Dies ist in einigen Fällen unerwünscht, da hierbei Informationen verloren gehen können (Man spricht hier von verlustbehafteter Transformation. Ist die Speicherschicht erst einmal befüllt, können die Quellsysteme nicht wieder 1:1 abgebildet werden.). Data Vault Modeling bzw. Modellierung wurde entwickelt, um diese Nebeneffekte zu vermeiden oder zu minimieren. (engl.: Vault steht für Kammer, Gewölbe oder Tresor. Da der Begriff als Eigenname der Methode behandelt werden soll, wird auf eine Übersetzung verzichtet.)

Dan Linstedt, der Erfinder dieser Methode beschreibt das Ergebnis wie folgt:

Der Data Vault ist eine detailorientierte, historisch genaue und eindeutig nachvollziehbare Anordnung von normalisierten Tabellen...

that support one or more functional areas of business. It is a hybrid approach encompassing the best of breed between 3rd normal form (3NF) and star schema. The design is flexible, scalable, consistent and adaptable to the needs of the enterprise[6]

Data Vault's philosophy is that all data is relevant data, even if it is "wrong". Data being wrong is a business problem and usually not a technical problem. This means you have to be able to capture all the data. Another issue to which Data Vault is a response is that more and more there is a need for complete auditability and traceability of all the data in the datawarehouse. Due to Sarbanes-Oxley in the USA and similar measures in Europe this is a relevant topic for many business intelligence implementations, hence the focus of any Data Vault implementation on complete trace-ability and auditability of all information.