Was hat eine Kettlebell oder das Training mit einer Kettlebell mit Datenmodellierung zu tun?
Nichts, oder? Oder doch?
Kettlebell - Egal ob du ein normaler Mensch bist, der sich nicht mehr damit zufrieden gibt, schwach und weich zu sein, ein Sportler, der den Kick sucht, oder ein Berufstätiger mit extremen physischen und psychischen Anforderungen - hier bist du richtig. (StrongFirst)
Data Modeling - Egal, ob du ein normaler Mensch bist, der sich nicht mehr mit ungenauen und fehlerhaften Daten zufrieden gibt, ein Analyst, der den Kick sucht, oder ein Angehöriger eines Berufs mit extremen Anforderungen an die Qualität, Konsistenz und Integrität von Daten - hier bist du richtig. (Dirk Lerner)
Eine nicht ganz ernst gemeinte Analogie zwischen einem Sportgerät und der Datenmodellierung, um die Vorteile des Sports auf die Welt der Datenmodellierung zu übertragen.
Datavault und Machine Learning - passt das zusammen?
Wie kann eine modellgetriebene Datavault-Architektur dabei unterstützen, Machine Learning zu automatisieren und zu operationalisieren. Von der Verwaltung von Features, Algorithmen, Parametern und Training Scores für die praktische Anwendung von ML Models.
Die Wunder des Data Mart - das Dimensionale auf dem Relationalen
Was braucht eine Automatisierung des Data Marts eigentlich an Metadaten?
Wer sich die Frage stellt, stellt sogleich fest, dass es nicht klar festgelegt ist, wie ein Data Mart in einem Data Vault Warehouse auszusehen hat.
Kimball hat 2015 in seinem Buch ‚The Kimball Group Reader‘ bemängelt, dass es keinen Standardweg vom relationalen Data Warehouse in die dimensionalen Data Marts gibt (S.199-201). Und es stimmt, wir haben keine spezielle Nomenklatura zur Beschreibung eines solchen Data Mart. So werden die Dimensionen häufig anhand von SCD Typen beschrieben, obwohl das Core Warehouse mit seiner vollständigen Historie, ganz andere Möglichkeiten bietet.
Dabei kann es einfach sein. Ausgehend von den Konzepten im dimensionalen Modell wird geprüft, was sich durch ein integriertes historisiertes Data Vault Core Warehouse ändert bzw. verbessert werden kann. Herauskommen 5 Kriterien mit denen sich ein Data Mart komplett beschreiben lässt. Diese Kriterien bilden die Anforderungen aus dem Business an den Data Mart und sind leicht zu vermitteln.
Nicht immer werden alle Konzepte und Lösungen benötigt. Die 5 Kriterien zeigen einen klaren Weg auf, wie der Data Mart mit seinen Anforderungen an die Funktionalität wächst.
Verwendung des AutomateDV dbt package am Beispiel eines Kundenprojektes bei einer Bank im Lichtenstein
In einer Zeit, in der jeder nur noch von der Cloud spricht, gibt es immer noch spannende Projekte, die sich ( meist aus Datenschutz-Gründen) 100% on-Premises abspielen.
Wir haben die Challenge angenommen und mit modernen Tools (dbt, AutomateDV, Apache Hop) ohne direkten Internetzugriff ein komplexes und zukunftssicheres Data Vault DWH für ein Finanzumternehmen in Liechtenstein aufgebaut.
Über unsere Erfahrungen möchten wir Euch gerne berichten!