SQL Server Analysis Services im mehrdimensionalen Modus Grundkurs

SCD – oder: langsam veränderliche Dimensionen

LinkedIn Learning kostenlos und unverbindlich testen!

Jetzt testen Alle Abonnements anzeigen
Weil die korrekte Historisierung von Daten so wichtig ist, und sie bereits im Data Warehouse erfolgen muss, sollte man unbedingt das dazu von Ralph Kimball erfundene Konzept der "Slowly Changing Dimensions" kennen.
04:16

Transkript

In diesem Teil unseres Video-Trainings suchen wir ja nach Gründen, warum wir ein Data Warehouse unter unserere Analysis Services Cubes packen sollten. Und der beste Grund dafür sind die Verfahren zur Historisierung von Daten, die Ralph Kimball zuerst entdeckt und unter dem Überbegriff Slowly Changing Dimensions (SCD) beschrieben hat. Er hat sie dann auch benannt und Typ 1 und Typ 2 benannt. Das ist ja relativ langweilig und vielleicht ist dieser langweiligen Name der Grund, warum Kunden sehr, sehr oft nicht verstehen, warum man sich diesen Aufwand mit der Historisierung beim Laden ins Data Warehouse macht. Ich will hier auch mit dem Vorurteil aufräumen, dass Historisierung etwas wäre, was vielleicht der OLAP Cube abhandelt. Nein, das passiert mit diesen beiden Verfahren alternative schon vorher im Data Warehouse. Was hat sich Ralph Kimball dabei gedacht? Also, was völlig normal ist im Data Warehouse, ist dass in Faktentabellen neue Daten reinkommen. Das sind zum Beispiel Verkaufsdatensätze, die kommen ständig immer wieder neu, wenn verkauft wird. Relativ selten kommen neue Zeilen auch in Dimensionstabellen rein. Zum Beispiel wenn ich ein neues Produkt einführe, dann muss ich das erst in die Dimensionstabelle einführen und danach kann ich dafür Verkäufer aufnehmen. Oder wenn ich eine neue Filiale eröffne, neuer Eintrag auch hier in die Dimensionstabelle und dann bekomme ich eben Verkaufsinformationen auch für diese Filiale. Jetzt aber der Sonderfall, über den Ralph Kimball nachgedacht hat. Das ist dann, wenn sich ein Attribut eines Dimensionelementes ändert. Ein Kunde zum Beispiel zieht um, dann ändert sich sein Attribut Postleitzahl oder Bundesland oder so allein dadaruch, dass er umgezogen ist. Oder für in Deutschland vielleicht noch typischer, ich reorganisiere meine Verkaufsorganisation. Ich fasse alle meine Läden zu neuen Verkaufsregionen zusammen und dann ändert sich am Laden jeweils das Attribut Verkaufsregion. Und wie gehe ich jetzt mit diesen Änderungen um? Was mache ich mit diesen Änderungen? Ich kann eben vorgehen nach SCD Typ 1, dabei überschreibe ich die Historie, oder wie Kimball eben auch beschreibt nach Typ 2, und dabei bewahre ich die Historie auf. Und das ist natürlich für ein Data Warehouse sehr, sehr wichtig. Gucken wir uns aber zum besseren Verständnis erst einmal den Typ 1 an. Bei Typ 1 mache ich im Data Warehouse genau das, was auch im operativen System passiert. Also wenn wir hier zum Beispiel den Brian nehmen. Das ist ein Kunde bei uns und das ist ein Blick auf seine Dimensionstabelle. Der Brian wohnt in Washington, aber der ist ja noch relativ jung, 1976 geboren, der möchte noch was erleben, der zieht um. Zum Beispiel zieht er nach Kalifornien und dort betritt er vielleicht ein Ladengeschäft von uns und sagt, Guten Tag, ich kaufe jetzt hier ein und ich bin umgezogen übrigens. Dann fragen die ihn natürlich, wo wohnen Sie denn jetzt? Und dann nehmen Sie zum Beispiel ihr Front Office System und tragen die neue Adresse ein und dabei wird die alte Information in der Regel im operativen System direkt überschrieben. Und das könnte ich im Data Warehouse genauso nachziehen. Also sprich, der ist umgezogen, ich ändere das Attribut State, von Washington auf Kalifornien, das ist eben mein neuer Satz. Und in dem Moment, wo ich das getan habe, ist die gesamte Historie verschwunden. Das hört sich zunächst mal super an, weil natürlich die Strukturen aktuell sind. Ich weiß genau, wo Brian im Moment wohnt und das dürfte ja das Wichtigste sein. Stimmt aber nicht ganz. Ich habe nämlich womöglich früher schon Umsätze mit Brian gemacht, vielleicht im Vorjahr oder so. Und die Berichte, die ich am Ende des Vorjahres über die Vorjahresumsätze gezogen habe, die entalten einen bestimmten Wert, und dieser Wert ist ebenfalls unter Einbeziehung der Zahlen von Brian entstanden. Wenn ich jetzt in den Stammdaten sage, Brian ist überhaupt kein Washingtoner mehr, sondern Kalifornier, dann gilt das auch für die Historie. Das heißt, der Gesamtumsatz für Washington im Vorjahr, was ja eigentlich längst abgeschlossen ist, wird reduziert, denn die historischen Umsätze werden jetzt im Nachhinein Kalifornien zugerechnet. Also dieses verhältnismäßig einfache Verfahren SCD Typ 1, ist sehr logisch, hat aber eine dunkle Seite. Das war der Versuch, zunächst einmal den Typ 1 von Ralph Kimball's Slowly Changing Dimensions verständlich zu machen.

SQL Server Analysis Services im mehrdimensionalen Modus Grundkurs

Lernen Sie eigene OLAP-Cubes und -Lösungen mit dem multidimensionalem Modus der SQL Server Analysis Services zu erstellen.

3 Std. 57 min (54 Videos)
Derzeit sind keine Feedbacks vorhanden...
Hersteller:
Software:
Exklusiv für Abo-Kunden
Erscheinungsdatum:25.04.2017

Dieser Online-Kurs ist als Download und als Streaming-Video verfügbar. Die gute Nachricht: Sie müssen sich nicht entscheiden - sobald Sie das Training erwerben, erhalten Sie Zugang zu beiden Optionen!

Der Download ermöglicht Ihnen die Offline-Nutzung des Trainings und bietet die Vorteile einer benutzerfreundlichen Abspielumgebung. Wenn Sie an verschiedenen Computern arbeiten, oder nicht den ganzen Kurs auf einmal herunterladen möchten, loggen Sie sich auf dieser Seite ein, um alle Videos des Trainings als Streaming-Video anzusehen.

Wir hoffen, dass Sie viel Freude und Erfolg mit diesem Video-Training haben werden. Falls Sie irgendwelche Fragen haben, zögern Sie nicht uns zu kontaktieren!