Tableau 10 Grundkurs

Datenquellen anbinden

LinkedIn Learning kostenlos und unverbindlich testen!

Jetzt testen Alle Abonnements anzeigen
Als Beispiele für die Anbindung der verschiedensten Datenquellen und -formate stellt dieses Video den Umgang mit Textdateien, mit Excel-Dateien und mit einer MySQL-Datenbank vor. Darüber hinaus lernen Sie, wie Sie mehrere Tabellen aus einer oder aus verschiedenen Datenquellen verbinden (JOIN).
12:45

Transkript

Wie Sie sicherlich wissen, ist "Tableau" beim Verarbeiten von Daten nicht auf ein bestimmtes, oder gar eigenes Format oder Managementsystem angewiesen. Die Auswahl ist riesig und wird von Release zu Release erweitert. Einzelne Dateien, Anbindungen an relationale Datenbanken OLAP Cubes und sogar Cloud Datenbanken oder Web Konnektoren. In diesem Abschnitt können wir leider nicht alle diese Möglichkeiten behandeln. Ich beschränke mich daher auf die Anbindung von Textdateien. Excel-Workbooks und MySQL-Datenbanken als Beispiel für einen Datenimport mit einem Datenbankserver. Dies ist natürlich nur eine kleine Auswahl der vorhandenen Schnittstellen. Zum einen decken diese Beispiele aber meiner Einschätzung nach alle in der Praxis vorkommenden Datenquellen ab. Zum anderen stehen diese exemplarisch für weitere Formate. Für die verbleibenden spezielleren Schnittstellen gibt es in der großen Support Community zahlreiche Posts, die auf die Besonderheiten bei der Anbindung der einzelnen Quellsysteme ausführlich eingehen. Die einfachste Form Daten für ihre Wiederverwendung zu sichern ist, sie in einer Textdatei abzuspeichern. Um diese Daten für "Tableau" verwenden zu können, sollten Sie zumindest in einer Tabellenstruktur in der Datei vorhanden sein. Das heißt, wie in diesem Beispiel, die Elemente in Zeilen und Spalten angeordnet. Alle Zeilen enthalten die gleiche Anzahl von Elementen und alle Elemente einer Spalte dasselbe Datenformat. Das Ende einer jeden Zeile ist mit dem Steuerzeichen "Neuer Absatz" markiert, üblicherweise durch Drücken der Eingabetaste. Und alle Elemente innerhalb einer Zeile sind durch dasselbe Zeichen voneinander getrennt. Üblicherweise ein Semikolon oder wie hier ein Tabulatorzeichen, bei dessen Verwendung allerdings nur der Abstand, nicht aber das Zeichen selbst zu sehen ist. Eine solche Datei kann über die entsprechende Option auf der Startseite leicht eingebunden werden. Hier auf der Datenquellenseite sehen Sie sofort, ob und wie "Tableau" die Daten eingelesen hat. Überprüfen Sie hier am besten gleich, ob "Tableau" den richtigen Datentyp erkannt hat. Falls nicht, ändern Sie ihn hier und am besten sofort. Falls bei einer Textdatei die Anordnung der Elemente oder das korrekte Einlesen von Sonderzeichen nicht geklappt hat, können Sie dies in einem Kontextmenü ändern. "Feldtrennzeichen", "Texttrennzeichen", "Zeichensatz", sogar das "Gebietsschema". Dies betrifft unter anderem das Zeichen zur Trennung von Dezimalzahlen, also Komma oder Punkt. Vor dem Schließen ändere ich das Gebietsschema auf "Deutschland". Üblicherweise enthält eine Datenquelle auch für jede Spalte eine Bezeichnung. Bei Textdateien oder Excel-Tabellen werden sie in der ersten Zeile hinterlegt und falls nicht automatisch erkannt, hier das Häkchen gesetzt. Falls die Datenquelle wie hier keine Spaltenbezeichnung enthält, können die vorläufig vergebenen Namen hier umbenannt werden und so weiter. Noch ein kleiner Hinweis, in der linken Seitenleiste sehen Sie unter "Dateien" alle Textdateien, die "Tableau" im Verzeichnis der gewählten Datei gefunden hat. Falls gewünscht, können Sie somit die momentan verwendete Datei leicht gegen eine andere austauschen. Sind die Daten korrekt eingelesen, können Sie mit einem Klick auf einen Reiter für ein neues Arbeitsblatt zur Bearbeitung einer Ansicht gelangen. Prinzipiell genauso können Sie Dateien im Excel-Format einbinden. Der wesentliche Unterschied liegt in der Organisation der Daten. In Excel müssen Sie sich zum Beispiel nicht darum kümmern, wie Zeilen und Spalten voneinander getrennt werden. Sie ordnen die Daten tabellarisch an, achten darauf, dass jede Spalte in der ersten Zeile eine Bezeichnung hat und geben der Tabelle unten im Reiter einen entsprechenden Namen. Stehen die Daten aus mehreren Tabellen zueinander in Beziehung, empfiehlt es sich diese in einer Excel-Arbeitsmappe zusammenzufassen und als eine Datei abzuspeichern. Aber nun zum Einbinden einer solchen Datei. Wechseln sie dazu entweder auf die Start- oder auf die Datenquellenseite. Selbst aus dem Arbeitsbereich heraus haben Sie die Möglichkeit, eine weitere Datenquelle einzubinden. Wie Sie auch immer zur Auswahl der Anbindungsmöglichkeiten kommen, klicken Sie auf die "Excel-Option" und im folgenden Dialog wählen Sie die gewünschte Datei aus. Danach gelangen Sie wieder auf die Datenquellenseite. Hier sehen Sie diesmal in der linken Seitenleiste unter "Blätter" alle Tabellen der gewählten Datei. Sie können nun aus den aufgelisteten Tabellen eine auswählen oder per Doppelklick oder "Drag and Drop" in die freie Fläche verschieben. Falls Sie sich nicht sicher sind, welche der Tabellen, die von Ihnen gewünschte ist, können Sie über das Symbol rechts eine Vorschau auf die darin enthaltenen Daten anzeigen lassen. Wie bei den Textdateien empfiehlt es sich auch hier, die von "Tableau" automatisch gewählten Datentypen auf Korrektheit zu überprüfen und sie gegebenenfalls zu ändern. Die korrekte Weitergabe von Sonderzeichen übernimmt in der Regel Excel beim Abspeichern einer Datei. Auch hier kann die gewählte Tabelle jederzeit gegen eine andere ausgetauscht werden. Oder aber Sie möchten zwei oder mehrere Tabellen verbinden. Dies können Sie dann tun, wenn es a) in einer Tabelle mindestens ein Feld gibt, dass mit einem Feld einer andere Tabelle in einer inhaltlichen Beziehung steht und b) wenn die Felder vom selben Datentyp sind und c) zumindest ein gemeinsamer Wert vorhanden ist. Diese Art von Beziehung zwischen zwei Tabellen finden Sie in einer Datenbank sehr häufig. Vor allem in solchen, in denen die enthaltenen Daten nach dem sogenannten Relationalen Datenmodell strukturiert sind. Eine auf Grund einer solchen Verbindung hergestellte Beziehung wird in der Fachsprache "Join" genannt. Zurück zu unserem Beispiel. In dieser Datenquelle gibt es ja zwei Tabellen. Wir schauen uns also an, ob es Felder gibt, die in einer inhaltlichen Beziehung zueinander stehen. Tatsächlich finde ich in der Tabelle "User" ein Datenfeld mit dem Namen "Status". Genau derselbe Name, den auch die zweite Tabelle trägt. Aber auch vom selben Datentyp, wie die erste Spalte "statusType". Zu dem finde ich in "Status" zumindestens einen Wert, der auch in "statusType" enthalten ist. Damit kann ich, ohne es 100% zu wissen, eine inhaltliche Bezeichnung annehmen. Platziere ich diese Tabelle neben der Ersten, versucht "Tableau" automatisch Felder zuzuordnen. Haben Felder aus unterschiedlichen Tabellen denselben Namen, findet "Tableau" auch fast sicher diese und zeigt eine Verbindung an, die ich aber auch bearbeiten kann. Ich kann zum Beispiel weitere Felder zuordnen. Das benötige ich bei Verbindungen, die mehrere Felder umfassen. Oder ich wähle die passende Art der Verbindung aus. Auch ohne Erfahrung mit den Diagrammen aus der mathematischen Mengenlehre, so denke ich, erkennen Sie die Unterschiede zwischen den Arten sehr gut. Bei Ihnen werden im Ergebnis nur Tabellenzeilen berücksichtigt, die in den Feldern der eingestellten Verbindung Werte enthalten, die in beiden Tabellen vorkommen. Die also in der anderen Tabelle eine Entsprechung haben. Symbolisiert durch die kleine blaue Fläche, die von beiden Kreisen stehen für die Tabellen, umfasst wird. Die sogenannte Schnittmenge. Dagegen enthält das Ergebnis bei Links, beziehungsweise Rechts, auch Einträge, die in den Verbindungsfeldern Werte enthalten, die in der anderen Tabelle nicht vorkommen. Symbolisiert durch die blaue, beziehungsweise weiße Kreisfläche. Die ausgegrauten Verbindungstypen sind nicht bei jeder Datenverbindung verfügbar. Die letzte hier gezeigte Anbindungsvariante erfordert einen Datenbankserver, der a) in Betrieb ist, b) lokal oder über ein Netzwerk ansprechbar ist und zu dem Sie eine Zugangsberechtigung besitzen. Das kann ein Datenbankmanagementsystem der Firma "Oracle", "Microsoft" oder eben auch wie hier das frei verfügbare "MySQL"-Paket sein. Ich gehe also davon aus, dass Sie, wie ich hier einen Server gestartet haben, dieser lokal oder über ihr Netzwerk ansprechbar ist und auf den Sie eine Zugangsberechtigung besitzen. Wählen Sie also aus den Verbindungsoptionen ihren Servertyp, in meinem Fall "MySQL", aus und gebe Sie die Verbindungs- und Zugangsinformationen ein. Nach erfolgreichem Aufbau der Verbindung können Sie aus der oberen Liste eine Datenbank auswählen. Danach haben Sie, wie bei der Excel-Variante auf der linken Seite Zugriff auf die in der Datenbank enthaltenen Tabellen. Alles andere verläuft analog zur Anbindung von Excel-Tabellen. Zum Beispiel kann ich auch hier die zwei Tabellen verknüpfen. Eine wichtige Zusatzoption bei der Anbindung an ein Datenbankmanagementsystem ist allerdings die Möglichkeit über den Dialog "Custom SQL" selbst formulierte SQL-Statements ausführen zu lassen, dazu ein kleines Beispiel. Damit haben Sie das letzte Beispiel der drei Möglichkeiten kennengelernt mit denen Sie Daten an "Tableau" anbinden können. Wie bereits erwähnt, finden Sie in der großen Support-Community zahlreiche Post, die auf die Besonderheiten bei der Anbindung fast aller Quellsysteme ausführlich eingehen. War Ihnen das Ganze bisher zu aufwendig oder zeit-intensiv? Dann habe ich zum Abschluss noch eine kleine Überraschung für Sie. Es geht auch einfacher. Möchten Sie Daten von überschaubarem Umfang einbinden, die sich zudem nicht ändern oder einfach nur mal was ausprobieren, dann können Sie dies ganz einfach mit herkömmlichem Copy + Paste tun. Dabei markieren Sie in einer Datei, Datenquelle, einem Dokument oder in einer Webseite, die gewünschten Daten, kopieren diese in eine Zwischenablage und fügen Sie mit "Paste" in "Tableau" ein. Sprich "Command V" bei Mac oder "Control V" bei Windows. Noch zwei Bemerkungen dazu. Erstens sollen die Daten, wie bei allen Datenquellen, in einer Tabellenstruktur vorliegen und zweitens sollten Sie die so erstellt in Arbeitsmappen als Arbeitsmappenpakete exportieren. "Tableau" hätte sonst keine Möglichkeit beim erneuten Öffnen, auf die Daten zuzugreifen. Damit sind wir am Ende dieses wichtigen Arbeitsschrittes und in den Sie keine Visualisierung erstellen können. Sie haben gesehen, wie Sie Daten aus den verschiedensten Formaten und Quellsystemen einbinden können. Und soll das mal schnell gehen? Einfach Copy + Paste.

Tableau 10 Grundkurs

Analysieren, visualisieren und präsentieren Sie Ihre Daten mit Tableau 10.

2 Std. 54 min (33 Videos)
Derzeit sind keine Feedbacks vorhanden...

Dieser Online-Kurs ist als Download und als Streaming-Video verfügbar. Die gute Nachricht: Sie müssen sich nicht entscheiden - sobald Sie das Training erwerben, erhalten Sie Zugang zu beiden Optionen!

Der Download ermöglicht Ihnen die Offline-Nutzung des Trainings und bietet die Vorteile einer benutzerfreundlichen Abspielumgebung. Wenn Sie an verschiedenen Computern arbeiten, oder nicht den ganzen Kurs auf einmal herunterladen möchten, loggen Sie sich auf dieser Seite ein, um alle Videos des Trainings als Streaming-Video anzusehen.

Wir hoffen, dass Sie viel Freude und Erfolg mit diesem Video-Training haben werden. Falls Sie irgendwelche Fragen haben, zögern Sie nicht uns zu kontaktieren!