Am 14. September 2017 haben wir eine überarbeitete Fassung unserer Datenschutzrichtlinie veröffentlicht. Wenn Sie video2brain.com weiterhin nutzen, erklären Sie sich mit diesem überarbeiteten Dokument einverstanden. Bitte lesen Sie es deshalb sorgfältig durch.

R und RStudio Grundkurs

Einführung in Dataframes

LinkedIn Learning kostenlos und unverbindlich testen!

Jetzt testen Alle Abonnements anzeigen
In diesem Video lernen Sie den Unterschied zwischen Matrizen und Dataframes kennen. Sie wissen im Anschluss, wann die Anwendung eines Dataframes der einer Matrix vorzuziehen ist.
08:55

Transkript

In diesem Video möchte ich Ihnen zeigen, wie Sie in R mit Dataframes arabeiten. Dataframes sind ein sehr mächtiges Werkzeug. Mit Matrizen können Sie sehr leicht arbeiten und rechnen, wenn Sie Daten des selben Datentyps haben. Häufig liegen Ihnen die Informationen ode die Daten jedoch in unterschiedlichen Datentypen vor. In diesem Fall können Sie mit Matrizen nicht mehr viel anfangen, Sie müssen auf Dataframes zurückgreifen. Und wie Sie das machen können, das möchte ich Ihnen jetzt zeigen. Öffnen Sie bitte RStudio, öffnen Sie ein neues Script und speichern Sie das Ganze unter Dataframe. Angenommen Sie haben drei Vektoren, ein Vektor heißt name, und dieser Vektorname beinhaltet vier Namen, Julia, Fred, Tom und Mia. Außerdem haben Sie eine Vektorgröße, dieser beinhaltet vier Werte, 1,55, 1,60, 1,90 und 1,67. Außerdem haben Sie einen Vektorgewicht, dieser Vektor beinhaltet auch vier Werte, 50, 50, 80 und 70. Das können Sie alles ausführen, und Sie sehen auf der rechten Seite, wir haben drei Vektoren, unterschiedlichen Datentyps, zwei nummerische Vektoren und einen Charakter. Nun könnne Sie die Vektoren zu einer Matrix zusammenbinden. Nennen Sie die Matrix gesund, und nutzen Sie den Befehl cbind um die Vektoren spaltenweise zusammenzubinden. Und Sie sehen auf der rechten Seite, wir haben eine Matrix erzeugt, die nur Charakter enthält, vier Zeilen und drei Spalten groß ist. Gucken wir und das genau an. Tatsächlich, auch Größe und Gewicht werden nun als Character ausgewiesen. Das sehen wir an den Anführungszeichen. Woran liegt das? Es liegt daran, dass der Vektorname einem Character entspricht. Character ist im Grunde der schwächste Datentyp. Alle anderen Datentypen werden dem schwächsten Datentyp in einer Matrix angepasst. Das heißt, alle anderen Daten werden jetzt auch zu Character. Jedoch können wir mit Character nicht rechnen. Aus diesem Grund ist es hier sinnvoll auf Dataframes zurückzugreifen. Vektoren zu Dataframe zusammenbinden, mit data.frame, Name, Größe und Gewicht. Und nun sehen wir auf der rechten Seite von RStudio, dass wir ein Dataframe erzeugt haben. Dieses Datframe enthält vier Beobachtungen, mit je drei Variablen. Wir können auf den File klicken, und sehen die einzelnen Variablen, Name, Größr und Gewicht, mit den jeweiligen Beobachtungen. Größe und Gewicht sind nummerisch, nur Name ist jetzt kein Character mehr, sondern ein Faktor, ein sogenannter Facor. Was heißt das? R hat erkannt, dass Name nicht nummerisch ist, sondern eine kategoriale Variable, mit vier Ausprägungen, Fred, Julia, Mia und Tom. Die zahlen hier hinten entsprechen übrigens der Reihnfolge der Namen, geordnet nach den Anfangbuchstaben. Das heißt, mit einem Faktor, können Sie immernoch nicht rechnen, aber Sie können Häfigkeiten bilden. Sie können sich zum Beispiel ausgeben lassen, wie oft Fred, Julia und so weiter in Ihrer Datenbank vorkommt. Angenommen Sie hätten hier nicht den Namen, sondern das Geschlecht, dann können Sie sich die Anzahl der Frauen und die Anzahl der Männer in Ihrer Stichprobe augeben lassen. Mit dem Befehl str, können Sie sich die Datentypen in Ihrem Dataframe ausgeben lassen. Und Sie erhalten die selbe Tabelle wie hier auch. Ein Vorteil von RStudio ist dieser, dass Sie sich diesen Daraframe auch als Tabelle an einem schiken Tablo anzeigen lassen können. Und zwar mit view, Dataframe in Tabelle anzeigen lassen. Mit dem Befehl view, achten Sie bitte darauf, dass View großgeschrieben wird, denn R ist Casesensitiv, das heißt, es spielt eine Rolle, ob Sie die Befehle groß oder klein schreiben. Wenn Sie den Befehl ausführen, ergalten Sie diese schike Tabelle Ihres Dataframes. Sie können jetzt zum Beispiel Ihre Tabelle nach den Vornamen Ihrer Probanten sortieren, oder nach der Größe oder nach dem Gewicht, in absteigender oder aufsteigender Reihenfolge. Übrigens zum Thema Datentyp. Es gibt mehr als 2 Datentypen. Hier sehen Sie eine Tabelle mit den Datentypen. Den Character haben Sie bereits kennengelernt, das ist die Zeichenkette. Es ist möglich in R komplexe Zahlen darzustellen, mit der Abkürzung cplx. Die Gleitkommzahl haben Sie auch schon kennengelernt. Es gibt double oder numeric. Integer sind auch möglich, also ganze Zahlen, logical beschreiben einen llogischen Wert, also ist etwas wahr oder falsch, true oder false. Es ist möglch mit Binär-/Hexaderzimalzahl in R zu arbeiten, und ein ganbz besonders Feature von R ist der Fakor oder auch Factor. Dieser ist reserviert für kategoriale Objekte bzw. für kategoriale Variablen, in einem Dataframe. Unser Name ist zum Beispiel so ein kategoriales Objekt. Dieses Objekt hat verschiedene Ausprägungen, Julia, Tom, Mia oder Fred. Ein anderes wäre zum Beispiel das Geschlecht oder die Farbe eines Schiffes, aber auch der Schulabschluss in einer Stichprobe von Arbeitnehmern wäre so ein kategoriales Objekt, mit dem Datentyp Factor. Wir können also Häufigkeiten bilden. In diesem Video haben Sie gesehen, wie Sie in R mit Dataframes arbeiten können und welche Vorteile Dataframes im Vergleich zu Matrizen haben. Sie wissen jetzt welche Datentypen in R vorkommen können, und welche besondere Bedeutung diesem Datentyp Faktor oder auch Factor zugesprochen werden kann.

R und RStudio Grundkurs

Lernen Sie, wie Daten mit der Programmiersprache R statistisch ausgewertet, geplottet und exportiert werden können.

2 Std. 29 min (16 Videos)
Derzeit sind keine Feedbacks vorhanden...
 
Software:
R R 3
Exklusiv für Abo-Kunden
Erscheinungsdatum:17.11.2016

Dieser Online-Kurs ist als Download und als Streaming-Video verfügbar. Die gute Nachricht: Sie müssen sich nicht entscheiden - sobald Sie das Training erwerben, erhalten Sie Zugang zu beiden Optionen!

Der Download ermöglicht Ihnen die Offline-Nutzung des Trainings und bietet die Vorteile einer benutzerfreundlichen Abspielumgebung. Wenn Sie an verschiedenen Computern arbeiten, oder nicht den ganzen Kurs auf einmal herunterladen möchten, loggen Sie sich auf dieser Seite ein, um alle Videos des Trainings als Streaming-Video anzusehen.

Wir hoffen, dass Sie viel Freude und Erfolg mit diesem Video-Training haben werden. Falls Sie irgendwelche Fragen haben, zögern Sie nicht uns zu kontaktieren!