Tableau 10 Grundkurs

Aggregation und Einzelwerte

LinkedIn Learning kostenlos und unverbindlich testen!

Jetzt testen Alle Abonnements anzeigen
Die zwei grundlegenden Arbeitsprinzipien von Tableau sind die Berechnung durch Aggregation von Werten mittels entsprechender Funktionen oder Anzeige von Einzeldaten.
10:13

Transkript

Vielleicht ist Ihnen schon das Datenfeld "Anzahl der Datensätze" aufgefallen. Hinter kursiv gesetzten Namen, wie diesem hier, verbergen sich Felder, die von "Tableau" automatisch zu jeder eingebundenen Datenquelle erstellt werde. Wie Sie sehen, ist "Anzahl der Datensätze" nicht das einzige kursive, also automatisch erzeugte Feld. Welche Daten enthält nun dieses Feld? Welche Rolle spielt es, wenn es denn zu jeder Datenquelle extra erzeugt wird? Außer dem kursivem Schriftstil können Sie vor dem Symbol für den Datentyp noch ein Gleichheitszeichen erkennen. Dies deutet auf ein sogenanntes berechnetes Feld hin. Ein Datenfeld, dessen Werte Ergebnisse einer mit Tableau erstellten Berechnung sind. Berechnete Felder werden mit Hilfe eines speziellen Dialogs erstellt und können damit auch wieder bearbeitet werden. Welche Berechnung verbirgt sich nun hinter "Anzahl der Datensätze"? Wie Sie sehen, enthält es lediglich eine "1". Das heißt, für jeden in dieser Datenquelle enthaltenen Datensatz, wird in einer zusätzlichen Spalte der Wert "1" eingetragen. Warum? Welchen Nutzen hat das? Lassen Sie mich zur Beantwortung dieser Frage zunächst zeigen, welches Prinzip "Tableau" grundsätzlich beim Aufbau von Ansichten zu Grunde liegt. In Tabellenkalkulationen, wie Excel, arbeiten Sie in der Regel mit Einzeldaten. Das heißt, Sie haben jeden einzelnen Wert vor Augen. Fügen Sie eine Formel hinzu, wird damit auch nur ein weiterer Wert berechnet. In "Tableau" enthalten die eingebundenen Datenquellen zwar auch alle Einzelwerte. In einer Ansicht bekommen Sie diese meistens aber nicht zu sehen. Wird eine Kennzahl einer leeren Ansicht hinzugefügt, fasst "Tableau" die Werte dieser Kennzahl aller Datensätze zu einem einzigen Ergebniswert zusammen, beziehungsweise visualisiert diesen zum Beispiel wie hier in Form eines Balkens. Kommt nun eine Dimension zu Ansicht, fasst "Tableau" weiterhin alle Werte zusammen, nunmehr aber in mehreren Ergebniswerten. Genauso viele, wie die Dimension Ausprägungen enthält. Mit jeder weiteren Dimension in der Ansicht verfeinert sich das Ergebnis in immer mehr Ergebniswerte. Das Zusammenfassen von Werten nennt "Tableau" "aggregieren". Das Ergebnis "Aggregation" und die Art und Weise, wie das Ergebnis zu Stande kommt, "Aggregationsfunktion". Sind dann die zugrundeliegenden Datensätze verschwunden? Keinesfalls. Nachwievor hält "Tableau" sie im Speicher. Wie wir gleich sehen werden, können Sie sich jederzeit anzeigen lassen. Hingegen haben Sie mit "Tableau" an keiner einzigen Stelle die Möglichkeit die Einzelwerte der zugrundeliegenden Datenquelle zu ändern. Das ist aber auch gut so. Und was hat dies mit unserem Feld "Anzahl der Datensätze" zu tun? Ich platziere es mal in einer leeren Ansicht. Was sehen wir hier? Ein Diagramm, auf dessen Skala wir das Ende des blauen Balkens bei circa 30.000 ablesen können. Und oben im Zeilen-Container eine grüne Kapsel auf der "Anzahl der Datensätze" und davor "SUM" steht. Was heißt das nun? Wie Sie sicher schon vermuten, hat "Tableau" hier etwas aufsummiert und das Ergebnis in Form eines Balkens angezeigt. Mit anderen Worten, eine Summe visualisiert. Aber was genau? Und wie ist das geschehen? Wie wir zuvor gesehen haben, enthält jeder Datensatz in der Spalte "Anzahl der Datensätze" durch das berechnete Feld mit demselben Namen eine "1". Wenn "Tableau" nun "SUM" eine Aggregationsfunktion, die tatsächlich Werte aufsummiert, über alle ihre Datensätze anwendet, sprich alle einzeln nacheinander aufaddiert, dann steht am Ende dieser Aufsummierung genau die Anzahl der Datensätze in dieser Datenmenge. Was dieser Name ja auch nahelegt. Mit anderen Worten, "Tableau" hat die Werte dieses Feldes über alle Datensätze auf eine Summe aggregiert. Füge ich nun eine Dimension dieser Ansicht hinzu, dann wird die Anzahl der Datensätze nach den Ausprägungen von "Sport", also den jemals bei olympischen Spielen vertretenen Sportarten differenziert angezeigt. Das heißt also, in der verfügbaren Datenmenge sind für "Leichtathletik" 3448 Datensätze enthalten. Was hier zudem der Anzahl der Medaillengewinner und Gewinnerinnen entspricht. Ich kann nun eine weitere Dimension hinzufügen und erfahre dadurch die Anzahl der vergebenen Medaillen pro Sportart weiterdifferenziert nach Herkunftsländern der Athleten. Das Prinzip der Aggregation, die sich an den Dimensionen einer Ansicht orientiert und dieses ihre sogenannte Detailgenauigkeit oder Granularität findet, bleibt immer dasselbe. "Tableau" kennt aber weitere Aggregationsfunktionen. Wenn ich zum Beispiel wie hier Kenngrößen über das Alter von Benutzern erfahren möchte, dann macht eine Summierung über die Altersangaben wenig Sinn. Stattdessen könnte mich zum Beispiel das Durchschnittsalter je nach Land interessieren. Dazu ändere ich die Aggregationsfunktion im Kontextmenü des Kennwertes. Oder ich möchte das Alter des jüngsten oder des ältesten Nutzers ermitteln. Dann finde ich hier die Aggregationsfunktion "Minimum", beziehungsweise "Maximum". Genauso wie zahlreiche andere statistische Kenngrößen. Können Aggregationsfunktionen tatsächlich nur auf Kennzahlen angewendet werden? Ja, diese müssen aber nicht immer nummerisch sein. Und ich kann sogar Dimensionen auch ad hoc in einer Ansicht zu Kennzahlen machen und damit auch Aggregationsfunktionen anwenden. Ich zeige das mal anhand einer Zeichenfolge hier im "Land" und am besten mit der Aggregationsfunktion, die mir die Anzahl der verschiedenen Werte ausgibt. Ich sehe also, dass es 12 verschiedene Länder gibt. Und wo ist die angekündigte Sicht auf Einzelwerte? Dazu zurück zu unserem Olympia-Beispiel. Sie haben bei "Tableau" jederzeit die Möglichkeit die einer Ansicht zu Grunde liegenden Datensätze anzeigen zu lassen. Entweder über das Kontextmenü die Daten eines einzelnen Elementes, dann sehe ich zunächst nur die Werte der Ansicht, klicke ich aber auf "Vollständige Daten", dann habe ich Einsicht in die kompletten Datensätze, die bei dem gewählten Element in irgendeiner Form beteiligt sind. Oder aber für die Daten der gesamten Ansicht. Dazu deselektiere ich das Element unter dem Menüpunkt "Analyse", "Daten anzeigen" und auch hier weiter auf die kompletten Datensätze mit "Vollständige Daten". Zu einer anderen Möglichkeit Einsicht in Einzelwerte zu bekommen, gelange ich durch Abschalten des Aggregationsmechanismuses. Zunächst einmal möchte ich die Anzahl der Medaillen anzeigen, die jeder Athlet gewonnen hat. Dazu baue ich in einem neuen Arbeitsblatt eine Liste auf mit "Athlet", den Zeilen und "Anzahl der Datensätze". Damit habe ich die gewünschte Medaillenzahl. Da hier und tatsächlich einem Datensatz oder einer Tabellenzeile der Datenquelle eine gewonnene Medaille entspricht. Dann schalte ich tatsächlich den Aggregationsmechanismus, der zu den Summen geführt hat, aus. Das tue ich unter dem Menüpunkt "Analyse", "Kennzahlen aggregieren" und wir sehen tatsächlich alle an den Summen beteiligten Werte in Einzeldarstellung. Hier die Einsen des berechneten Feldes "Anzahl der Datensätze eines jeden Datensatzes". Wozu soll das gut sein, wenn ich mir, wie gerade gesehen die Einzelwerte auch detailliert anzeigen lassen kann. Nun, ich kann dies zum Beispiel nutzen um wirklich jede einzelne Medaille bildlich darzustellen. Dazu eignen sich die einzeln nicht ganz so gut. Deshalb ändere ich die Art der Visualisierung in eine Kreisform und entferne die Beschriftung mit den Einsen. Da lauter blaue Kreise etwas langweilig sind und ich vielleicht auch noch wissen möchte, welche Art von Medaillen ein Athlet gewonnen hat, lege ich die Kapsel von "Medal" auf die Farbe. Jeder Kreis steht nun für eine einzelne Medaille und wenn ich möchte, kann ich noch weitere Informationen hinterlegen und bin nun vollständig informiert über die einzelnen Medaillen. Damit sollten Sie diese wichtigen Grundprinzipien verstanden haben, die jeder Ansicht zu Grunde liegen. Ich hoffe dies in diesem Klip nicht nur verständlich erklärt zu haben, sondern dass ich Sie auch zu einem kreativen Einsatz inspirieren konnte. Dazu habe ich zum Abschluss noch ein kleines Beispiel, wie Sie im unaggregierten Modus, zum Beispiel aus einer Mitarbeiterliste einen Geburtstagskalender erstellen können. Neben der Anordnung in Monate und Tage, sehen Sie durch die Größe der Kreise das Alter. Die Färbung repräsentiert, ob die Person dieses Jahr einen runden Geburtstag feiert.

Tableau 10 Grundkurs

Analysieren, visualisieren und präsentieren Sie Ihre Daten mit Tableau 10.

2 Std. 54 min (33 Videos)
Derzeit sind keine Feedbacks vorhanden...

Dieser Online-Kurs ist als Download und als Streaming-Video verfügbar. Die gute Nachricht: Sie müssen sich nicht entscheiden - sobald Sie das Training erwerben, erhalten Sie Zugang zu beiden Optionen!

Der Download ermöglicht Ihnen die Offline-Nutzung des Trainings und bietet die Vorteile einer benutzerfreundlichen Abspielumgebung. Wenn Sie an verschiedenen Computern arbeiten, oder nicht den ganzen Kurs auf einmal herunterladen möchten, loggen Sie sich auf dieser Seite ein, um alle Videos des Trainings als Streaming-Video anzusehen.

Wir hoffen, dass Sie viel Freude und Erfolg mit diesem Video-Training haben werden. Falls Sie irgendwelche Fragen haben, zögern Sie nicht uns zu kontaktieren!