Am 14. September 2017 haben wir eine überarbeitete Fassung unserer Datenschutzrichtlinie veröffentlicht. Wenn Sie video2brain.com weiterhin nutzen, erklären Sie sich mit diesem überarbeiteten Dokument einverstanden. Bitte lesen Sie es deshalb sorgfältig durch.

R und RStudio Grundkurs

Häufigkeitstabellen und Säulendiagramme

LinkedIn Learning kostenlos und unverbindlich testen!

Jetzt testen Alle Abonnements anzeigen
In diesem Video zeigt die Trainerin, wie Sie kategoriale Variablen mit Hilfe von Häufigkeits- bzw. Kontingenztabellen auswerten und Säulendiagramme erstellen können.
11:47

Transkript

In diesem Video möchte ich Ihnen zeigen wie Sie Häufigkeitstabellen und Säulendiagramme für kategoriale Variablen R erstellen können. Öffnen Sie dafür bitte RStudio und legen eine neue Scriptdatei an. Klicken Sie auf das kleine Plus, R Script und speichern Sie das Ganze unter Häufigkeiten. Im Vorfeld habe ich bereits einen Dataframe angelegt. Den können wir uns einfach mal anschauen. Dieser Dataframe besteht aus vier Variablen und je vier Einträgen. Wir möchten zu dem dataframe nun eine neue Spalte hinzufügen. Wir möchten eine neue Variable generieren, in der das Raucherverhalten unsere Probanden Julia, Fred, Tom und Mia beschrieben wird. Wir wollen eine Variable in dem Dataframe gesund erzeugen. Wir nennen diese Variable Raucher, benutzen das kleine C Combine, um unsere Informationen einzutragen. Wir wissen, dass die Julia, die erste Person eine Raucherin ist, und alle Anderen sind keine Raucher. Wir können das Ganze ausführen und uns dann noch einmal den Dataframe anschauen. Und tatsächlich wir haben jetzt eine weitere Variable hinzugefügt, nämlich das Raucherverhalten. Wenn Sie auf die rechte Seite klicken, können Sie auch sehen welchen Datentyp Raucher hat. Die Variable Raucher ist ein Charakter, eine Zeichenkette. Das ist jedoch nicht günstig. Wir möchten gerne, dass Raucher zu einem Faktor wird, damit wir Häufigkeitstabellen damit erzeugen können. Also überschreiben wir Variable Gesund, Dollarzeichen, Raucher mit as.factor und beziehen uns dabei auf die jetzige Variable Gesund, Dollarzeichen, Raucher. Und tatsächlich Raucher ist jetzt ein Faktor mit zwei Ausprägungen, nämlich ja oder nein. Jetzt können wir relativ einfach eine Häufigkeitstabelle bilden. Wir wollen uns anschauen, wie viel Männer und wie viele Frauen in unserer Stichprobe rauchen. Wir nennen die neu erzeugte Tabelle tabraucher und weisen diesee Tabelle eben eine Tabelle zu mit table. Und in dieser Tabelle soll Geschlecht und Raucher aufgeführt sein und zwar von Dataframe Gesund. Schreiben hier lieber zuerst Geschlecht und dann Raucher. Das ist jedoch Geschmacksache. In Ordnung. Nun habe wir eine Tabelle angelegt, die heißt tabraucher, und wir können diese Tabelle einfach mal abrufen. Ok. Sie ist wirklich sehr einfach gehalten. Wir wissen, dass keine der Männer raucht in unserer Stichprobe, alle beide sind nicht Raucher. Wir wissen, dass die Julia raucht und dass die Mia nciht raucht, also eine Frau raucht, eine Frau raucht nicht. In Ordnung. Wir können uns noch die Randsummen zeigen lassen mit addmargins tabraucher. Und wir sehen, die Randsummen wir haben also insgesamt zwei Männer in unserer Stichprobe, zwei Frauen, wir haben eine Raucherin und drei Nichtraucher. Na, so gut können wir uns auch noch die relativen Häufigkeiten anschauen. Dafür gibt es den Befehl prop für Propotion, Punkt, Table. Hier geben wir den Tabellenamen an unserer absoluten Häufigkeiten, also im (...) unsere Kontingenztabelle tabraucher. Und nun müssen wir nur noch sagen, ob wir die relativen Häufigkeiten als Zeilenprozente haben wollen oder als Spaltenprozente. Zeilenprozente in dem Sinne, dass die Summe der relativen Häufigkeiten in der Zeile gleich Eins ergeben. Die Zeilenprozente können wir ganz einfach berechnen, indem wir nach dem Komma eine 1 eingeben. Und ich würde das Ganze einfach mal ausführen. Sie sehen, wir haben unter den Männern null Prozent Raucher, dafür 100 Prozent Nichtraucher, zumindenst in unserer Stichprobe und wir haben 50 Prozent Raucher bei den Frauen und 50 Prozent Nichtraucher. OK. Möchten wir die Spaltenprozente, dann geben wir einfach noch mal den Befehl prob.table ein, tabraucher, 2. Das sind die Spaltenprozente. Und wie Sie hier sehen, sind 100 Prozent der Raucher weiblich, 66 Prozent der Nichtraucher sind männlich und 33 Prozent der Nichtraucher sind weiblich in unserer Stichprobe. Als letztes können wir die Häufigkeiten in einem Säulendiagramm darstellen und zwar mit dem ganz einfachen Befehl barplot. Wir geben unsere Tabelle ein, und ich ändere noch die Beschriftung der y-Achse in Anzahl der Raucher. So, jetzt haben wir noch keine Legende. Die können wir jedoch auch hinzufügen, indem wir jetzt legend eingeben und als erstes die x und y Koordinate, wo die Legende dann sitzen soll. Hier in der rechten Seite ist es recht voll, deswegen würde ich vorschlagen, dass wir sie bei sogar 0,2 und 3 platzieren oder so bei x 0,2 und y gleich 3. Nun wollen wir die Legende noch ordentlich beschriften, und zwar als erstes sollen die Frauen ausgegeben werden, weiblich, als zweites die Männer, männlich. Wir können die Schriftgröße beeinflussen standardmäßig cex= 1, ich setze auf 0,8. Die Farbe machen wir gleich passend zu der Farbe der Blöcke, das heißt, Frauen bekommen grau, und die Männern bekommen schwarz. Dann können wir die Form noch festlegen, das sind die Symbole. Kleine Vierecke bekommt man, wenn man 0 eingibt. Das machen wir einmal für Männer, einmal für Frauen, genau, dann können wir diesen Befehl einfach mal ausführen, und es erscheint eine kleine Legende. Diese Grafik könnten Sie jetzt auch noch herausholen, wenn Sie auf Zoom klicken, dann sehen sie das Ganze etwas größer. Ja, also wir sehen insgesamt eine Frau, die raucht, zwei Männer, die nicht rauchen und eine weitere Frau, die nicht raucht. Und Sie können jetzt auch ganz bequem Grafik exportieren entweder als Bilddatei oder als PDF, können Sie, wenn Sie das Ganze als Bilddatei speichern möchten, festlegen, in welchem Format Sie das Bild haben wollen JPEG oder TIFF oder wie auch immer. Sie können sich aussuchen, wo die Datei gespeichert werden soll, also in welchem Ordner und natürlich auch noch den Namen. Ich nenne das Barplot_Raucher, und dann können Sie das Ganze abspeichern. OK, in diesem Video haben Sie gelernt, wie Sie für kategoriale Variablen Häufigkeitstabellen esrtellen können, Ansummen berechnen können, relative Häufigkeiten bestimmen können und das Ganze als Säulendiagramm darstellen können. Haben Sie weitere Fragen oder benötigen Sie jetzt insbesondere Hilfe bei dem Zeichnen von Diagrammen, können Sie sich der Funktion Help bedienen und geben dann zum Beispiel einfach mal plot beziehungsweise barplot ein und erhalten alle wichtigen Informationen, die Sie brauchen, um schöne Säulendiagramme darstellen zu können.

R und RStudio Grundkurs

Lernen Sie, wie Daten mit der Programmiersprache R statistisch ausgewertet, geplottet und exportiert werden können.

2 Std. 29 min (16 Videos)
Derzeit sind keine Feedbacks vorhanden...
 
Software:
R R 3
Exklusiv für Abo-Kunden
Erscheinungsdatum:17.11.2016

Dieser Online-Kurs ist als Download und als Streaming-Video verfügbar. Die gute Nachricht: Sie müssen sich nicht entscheiden - sobald Sie das Training erwerben, erhalten Sie Zugang zu beiden Optionen!

Der Download ermöglicht Ihnen die Offline-Nutzung des Trainings und bietet die Vorteile einer benutzerfreundlichen Abspielumgebung. Wenn Sie an verschiedenen Computern arbeiten, oder nicht den ganzen Kurs auf einmal herunterladen möchten, loggen Sie sich auf dieser Seite ein, um alle Videos des Trainings als Streaming-Video anzusehen.

Wir hoffen, dass Sie viel Freude und Erfolg mit diesem Video-Training haben werden. Falls Sie irgendwelche Fragen haben, zögern Sie nicht uns zu kontaktieren!