Unsere Datenschutzrichtlinie wird in Kürze aktualisiert. Bitte sehen Sie sich die Vorschau an.

R und RStudio Grundkurs

Mit Dataframes arbeiten

Testen Sie unsere 2021 Kurse

10 Tage kostenlos!

Jetzt testen Alle Abonnements anzeigen
Spielen Sie doch einmal ein wenig mit einem Dataframe herum: Sie lernen den Befehl "summary" kennen, der Ihnen erste statistische Auswertungen von Variablen ermöglicht. Das umfasst Häufigkeiten, Mittelwerte, Mediane, Quartile und Extremwerte.
09:06

Transkript

In diesem Video möchte ich Ihnen zeigen, wie Sie mit Dataframes arbeiten können. Öffnen Sie dafür bitte RStudio. Öffnen Sie eine neue Scriptdatei und speichern Sie die unter anwendungsfall_dataframe. Angenommen Sie haben vier Vektoren, die ich einfach mal hier hineinkopiert habe, einen Vektorname, ein Vektorgeschlecht, Größe und Gewicht. Diese Vektoren können Sie ausführen und mit dem Befehl Dataframe die zu einem Dataframe zusammenbinden. Nennen wir dieses Dataframe gesund und mit dem Befehl data.frame können wir die vier Vektoren zusammenschnüren. Wir haben also ein Dataframe erzeugt mit vier Variablen. Zwei Variablen sind Faktoren und zwei Variablen sind numerischer Natur. Nun löschen Sie einfach mal die Vektoren. Vektoren löschen oder allgemein löschen funktioniert über den Befehl remove Name, Geschlecht, Gewicht und Größe. Nun beinhaltet Ihre Environment nur noch den Dataframe Gesund mit den 4 Variablen. Probieren Sie nun einmal auf einen Variable zuzugreifen, zum Beispiel auf Name. Sie bekommen eine Fehlermeldung, das Objekt Name wurde nicht gefunden. Das liegt daran, dass in Ihrer Environment im Grunde nur das Dataframe liegt. Sie müssen erst auf das Dataframe zugreifen, bevor Sie auf eine Variable innerhalb des Dataframes zugreifen können. Das heißt, wir setzen die Variable Gesund einfach mal davor. Und Sie sehen, wir haben den Namen mit den Ausprägungen Fred, Julia, Mia und Tom. Lassen Sie uns mal auf das Geschlecht zugreifen. Hier sehen Sie genau, was es mit den Levels auf sich hat. Die Levels entsprechen den Ausprägungen der variable Geschlecht. Die variable Geschlecht hat genau zwei Ausprägungen, nämlich männlich und weiblich. Hier oben findne Sie lediglich die Ausprägungen, wie sie in ihrer Variable vorkommen. Nun wollen wir uns einzelne Werte zurückgeben lassen, beziehungsweise einzelne Zeilen. Gib alle Probanden zurück, beziehungsweise alle Zeilen zurück, die größer snd als 1.60 Meter. Dafür müssen Sie auch wieder den Dataframe aufrufen Gesund und in eckiger Klammer schreiben Sie, welche Zeilen angesprochen werden sollen. Also gesund, Dollarzeichen, Größe, denn Sie wollen auf die Variable Größe zurückgreifen. Die soll größer sein als 1,60 Meter. Und vergessen Sie das Komma nicht, denn Sie wollen ja die komplette Zeile zurückgegeben haben beziehungsweise alle Spalten, die zu den Zeilen gehören, die größer sind als 1,60 Meter. Und zwar haben wir zwei Probanden Tom und die Mia, die größer sind als 1,60 Meter, und von diesen Probanden wurde uns die komplette Zeile also mit allen Spalten zurückgegeben. Was ist, wenn wir nicht alle Spalten zurückgegeben haben wollen, zum Beispiel nur die Spalte Name und Gewicht. Dann können wir schreiben gesund, in eckiger Klammer gesund, Dollarzeichen, Größe größer als 1,60 Meter, Komma, und nun folgen die Spalten Name und Gewicht. Und Sie sehen, uns wurde für alle Personen, die größer als 1,60 Meter sind, Name und Gewicht zurückgegeben. Als nächstes beginnen wir mit einfachen statistischen Auswertungsverfahren. Mit einem ganz einfachen Befehl Summary können Sie sich schon einige relevante Kenngrößen anzeigen lassen. summary(gesund). Was sehen Sie hier? Es wird Ihnen ausgegeben den Namen, das Geschlecht, die Größe und Gewicht. Name und Geschlecht sind Faktoren. Das heißt, wir können hier keinen Mittelwert oder Median ausrechnen. Wir können hier wirklich zählen, wie oft zum Beispiel ein Name vorkommt. Hier der Name kommt genau einmal vor. Beim Geschlecht sieht es anders aus. M also die Männer kommen zweimal vor, W die Frauen auch zweimal. Bei numerischen Größen wie Größe und Gewicht können wir hingegen minimum bestimmen maximum erstes Quartil, drittes Quartil, Median und Mittelwert. Wie sich ein Mittelwert berechnen lässt, das können Sie sich gut vorstellen. Der Mittelwert hier liegt bei 1,68 und entspricht der Durchschnittsgröße unserer Probanden. Der Median teilt unsere Stichprobe genau in der Mitte. Das heit, 50 Prozent der Probanden sind kleiner als 1,63 Meter, und 50 Pronzent der Probanden sind größer als 1,63 Meter. Das erste Quartil trennt unsere Stichprobe bei 25 Prozent, das heißt 25 Prozent unserer Probanden sind kleiner als 1,58, und 75 Prozent sind größer als 1,58 Meter. Beim dritten Quartil ist es genau anders herum. 25 Prozent sind größer als 1,72, 75 Prozent hingegen sind kleiner als 1,72 Meter oder gerundert 1,73 Meter. Das heißt, 50 Prozent unserer Daten beziehungsweise 50 Prozent unserer Probanden ist zwischen 1,58 Meter beziehungsweise 1,95 Meter und 1,73 groß. Der kleinste Wert ist 1,55 Meter, der größte Wert ist 1,90 Meter. Analog kann man diese einzelnen Kennwerte für das Gewicht interpretieren. In diesem Video konnten Sie sehen, wie man mit Dataframes arbeitet und wie man schon die ersten statistischen Kenngrößen in R ermitteln kann.

R und RStudio Grundkurs

Lernen Sie, wie Daten mit der Programmiersprache R statistisch ausgewertet, geplottet und exportiert werden können.

2 Std. 29 min (16 Videos)
Derzeit sind keine Feedbacks vorhanden...
 
Software:
R R 3
Exklusiv für Abo-Kunden
Erscheinungsdatum:17.11.2016

Dieser Online-Kurs ist als Download und als Streaming-Video verfügbar. Die gute Nachricht: Sie müssen sich nicht entscheiden - sobald Sie das Training erwerben, erhalten Sie Zugang zu beiden Optionen!

Der Download ermöglicht Ihnen die Offline-Nutzung des Trainings und bietet die Vorteile einer benutzerfreundlichen Abspielumgebung. Wenn Sie an verschiedenen Computern arbeiten, oder nicht den ganzen Kurs auf einmal herunterladen möchten, loggen Sie sich auf dieser Seite ein, um alle Videos des Trainings als Streaming-Video anzusehen.

Wir hoffen, dass Sie viel Freude und Erfolg mit diesem Video-Training haben werden. Falls Sie irgendwelche Fragen haben, zögern Sie nicht uns zu kontaktieren!