Tableau 10 Grundkurs

Aufbereiten von Datenquellen

LinkedIn Learning kostenlos und unverbindlich testen!

Jetzt testen Alle Abonnements anzeigen
Verschaffen Sie sich zunächst einen Überblick, bevor Sie die eingebundenen Daten in Ansichten und Dashboards verwenden. Überprüfen Sie sie auf Korrektheit und passen Sie die Datenfelder gegebenenfalls an. Reduzieren Sie die Datenmenge durch Filter.
05:58

Transkript

Sie haben sich sicher schon einmal gefragt, welche Funktionen denn der untere Teil hier auf der Datenquellenseite hat. Sobald ich eine Tabelle in den weißen Bereich platziere und eine Datenverbindung erfolgreich zu Stande kommt, werden im unteren Bereich, dem sogenannten Datenraster alle Werte der ersten 1000 Zeilen angezeigt, was aber auch geändert werden kann und einige Möglichkeiten angeboten die Daten aufzubereiten. Hauptzweck dieser Ansicht ist es die eingelesenen Daten zu überprüfen und gegebenenfalls Korrekturen vorzunehmen. Was soll geprüft werden? Zunächst ist es gut zu sehen, dass überhaupt Werte ankommen. Dann in welchem Zustand, beziehungsweise Format kommen sie an? "Tableau" versucht den Werten automatisch passende Datentypen zuzuordnen. Also entweder als Zahl, Datum, Zeichenfolge oder buhlscher zweiwertiger Typ. Das gelingt meistens ganz gut. Ich empfehle aber auf jeden Fall dies zu überprüfen und gegebenenfalls zu ändern. Zum Beispiel sind bei Zeichenfolgen Umlaute, Sonderzeichen et cetera korrekt wiedergegeben, sind Zahlen als Zahl erkannt. Das ist vor allem bei Dezimalzahlen relevant, da manche Datenquellen als Trennung zwischen Ganzzahlteil und Dezimalstellen auf angelsächsische Art Punkte, statt dem kontinentalen Komma vergeben. Sind bei Datumsangaben Tage, Monate und Jahr korrekt erkannt, falls nicht oder falls sie gar nicht als Datumstyp erkannt worden sind, sollte dies ebenfalls geändert werden. Manchmal werden Daten einem Zahltyp zugewiesen, die aber besser als Zeichenfolge eingestellt werden sollten. Das passiert meistens bei Telefonnummern oder deutschen Postleitzahlen, wie hier bei Zip-Code. Hier fehlt die "0" bei Ostdeutschen Postleitzahlen. Das ist nicht gut, also wollen wir das sofort ändern. Möchten Sie sich die Datensätze sortiert anzeigen lassen, können Sie dies mit jedem Feld als Sortierkriterium tun. Aufsteigend oder absteigend. Dabei gelten je nach Datentyp die üblichen mathematischen, alphabetischen oder kalendarischen Ordnungen. Mit Hilfe einer weiteren Option können Sie sich leicht einen Überblick über alle tatsächlich vorkommenden Ausprägungen eines Datenfelds anzeigen lassen. Auch andere hilfreiche Informationen über seine Eigenschaften, die sogenannten Metadaten, sehe ich hier. Unter anderem kann ich hier erkennen, ob es sogenannte "Null"-Werte gibt. "Null" ist nicht zu verwechseln mit der Ziffer "0". "Null" hat sich in der Datenbankwelt als Indikator eingebürgert, um eben fehlende Werte in einer Datenquelle kenntlich zu machen. Sind Sie mit der Bezeichnung eines Datenfeldes nicht zufrieden, zum Beispiel beschreiben Sie nur unzureichend den Inhalt, können diese umbenannt werden. Dasselbe kann auch mit un- und missverständlichen Ausprägungen eines Datenfeldes gemacht werden. Die neuen Werte werden "Aliase" genannt. Die Anzeige kann dann auch zwischen Originalwerten und Aliasen umgeschaltet werden. Gerade bei Tabellen mit vielen Spalten, von denen Sie einige für die Auswertung gar nicht benötigen, empfehle ich Ihnen diese mit Hilfe einer Option auszublenden. Falls Sie die ausgeblendeten Felder wieder einblenden möchten, müssen diese erst sichtbar gemacht werden. Erst dann können Sie wieder eingeblendet werden. Um das Auffinden von Datenfeldern bei großen Tabellen zu erleichtern, kann hier die Reihenfolge auf unterschiedliche Weise bestimmt werden. Hier alphabetisch oder wie Sie in der Datenquelle vorkommen. Kommen wir noch zu einem zweiten wichtigen Bereich der Datenquellenseite. Gerade bei Tabellen mit sehr vielen Datensätzen sollten Sie sich überlegen, welche davon Sie für die Auswertungen tatsächlich benötigen. Alle anderen können hier oben in einem sogenannten Datenquellenfilter herausgefiltert werden. Dies verbessert zum einen die Performance, zum anderen unterstützt eine solche Vorfilterung Sie dabei den Überblick über eine große Datenmenge zu behalten. Ich weiß zum Beispiel schon im Vorfeld meiner Untersuchungen, dass ich nur deutsche User berücksichtigen möchte. Dann nehme ich als Filterkriterium "Country" und markiere "D" als einzig zulässigen Wert. Oder wenn ich in umgekehrter Logik alle User, außer den deutschen benötige, kann ich dies entsprechend als ausschließenden Filter einstellen. Dies kann unter Umständen eine erhebliche Verbesserung der Auswertungszeit bewirken. Zudem erspare ich mir für jede Ansicht das Hinzufügen dieses Country-Filters. Und sollten Sie mit einem Datenextrakt arbeiten wollen, so reduziert sich seine Größe in erheblichem Ausmaß ebenso. Damit sind wir am Ende unserer Übersicht über die vielfältigen und hilfreichen Möglichkeiten der Datenquelle angekommen. Ich hoffe, dass Sie diese nun gewinnbringend für die Vorbereitung zum eigentlichen Aufbauen von Ansichten einsetzen können.

Tableau 10 Grundkurs

Analysieren, visualisieren und präsentieren Sie Ihre Daten mit Tableau 10.

2 Std. 54 min (33 Videos)
Derzeit sind keine Feedbacks vorhanden...

Dieser Online-Kurs ist als Download und als Streaming-Video verfügbar. Die gute Nachricht: Sie müssen sich nicht entscheiden - sobald Sie das Training erwerben, erhalten Sie Zugang zu beiden Optionen!

Der Download ermöglicht Ihnen die Offline-Nutzung des Trainings und bietet die Vorteile einer benutzerfreundlichen Abspielumgebung. Wenn Sie an verschiedenen Computern arbeiten, oder nicht den ganzen Kurs auf einmal herunterladen möchten, loggen Sie sich auf dieser Seite ein, um alle Videos des Trainings als Streaming-Video anzusehen.

Wir hoffen, dass Sie viel Freude und Erfolg mit diesem Video-Training haben werden. Falls Sie irgendwelche Fragen haben, zögern Sie nicht uns zu kontaktieren!