Am 14. September 2017 haben wir eine überarbeitete Fassung unserer Datenschutzrichtlinie veröffentlicht. Wenn Sie video2brain.com weiterhin nutzen, erklären Sie sich mit diesem überarbeiteten Dokument einverstanden. Bitte lesen Sie es deshalb sorgfältig durch.

Excel: Statistische Funktionen

KOVARIANZ.P und KORREL

LinkedIn Learning kostenlos und unverbindlich testen!

Jetzt testen Alle Abonnements anzeigen
Gibt es einen Zusammenhang zwischen zwei Datenreihen? Der Korrelationskoeffizient beantwortet es.
07:33

Transkript

Haben Daten etwas miteinander zu tun? Haben zwei unterschiedliche Reihen einen Bezug zueinander oder miteinander? Kann ich davon ausgehen, dass sie miteinander korrelieren? Dafür gibt es einen Korrelationskoeffizienten, den ich in diesem Video vorstellen möchte. Ich habe eine Spalte "Größe in cm", "Gewicht in kg". Ganz deutlich, je größer, umso schwerer. Es gibt also einen offensichtlichen Zusammenhang, den man mithilfe einer Trendberechnung erkennen könnte oder man könnte ein Diagramm erstellen, um das Ganze visuell zu verifizieren oder zu zeigen. Der Korrelationskoeffizient, oft abgekürzt mit "r", berechnet sich folgendermaßen: Er verwendet die sogenannte "Kovarianz". Die sehen Sie hier, von x und y geteilt durch die Varianzen ausgehend von einer Grundgesamtheit, Das heißt, ich teile die Anzahl durch die Summe, jeweils bis zum Mittelpunkt. Lassen Sie uns mal kurz nachrechnen, wie man das Ganze berechnet und dann im zweiten Schritt natürlich in Excel nachschauen, welche Formel, welche Funktionen er dafür hat. Hier in der ersten Spalte haben wir die Größe, da können wir ganz schnell den Mittelwert berechnen von diesen Zahlen. Den Mittelwert kann ich kopieren und hier nebenan einfügen. Auch kein Problem. Auch die Varianzen sind kein Problem, Achtung die "VARIANZENA", wir gehen von der Grundgesamtheit aus, wir haben alle Daten, keine Stichprobe und ich möchte ja alle Daten vergleichen mit allen Daten. das kann ich hinüberziehen und -kopieren und habe jetzt die Varianzen von diesem Teil. Etwas schwieriger wird dagegen auszurechnen, "=", den Wert aus der Spalte "B" minus hier unten den Durchschnitt, also jeweils bis zum Durchschnitt. Achtung, den Durchschnitt muss ich natürlich fixieren. Und das Ganze wird quadriert, das heißt Klammer auf, Klammer zu, "^2". Berechne die Quadrate und ziehe das Ganze herunter. Das Ganze brauche ich nebenan noch einmal, "=" der andere Wert, den Sie als x oder y bezeichnen, minus wieder der Durchschnitt, absolut natürlich, das Ganze wird in Klammern gesetzt und am Ende "^2". Auch das wird wieder heruntergezogen. Von beidem brauche ich den Durchschnitt, das heißt, hier können wir die Summe der Werte teilen durch die Anzahl der Werte. Klammer zu für Anzahl. Das kann ich hinüberziehen oder -kopieren. Die Kovarianz, in unserem Beispiel als Hilfsgröße, berechnet sich nun folgendermaßen: Ich brauche nicht die einzelnen Quadrate, sondern jeweils das Produkt, das heißt, ich muss hier berechnen "=(" von diesem Wert den Abstand zu dem Durchschnitt, absolut, das Ganze mal "(" von dem anderen Wert, den Abstand zu seinem Durchschnitt absolut. Okay, das wird nun wieder heruntergezogen. Und auch davon berechnen wir wieder den Durchschnitt das können wir gleich hinüberziehen, da ist das Kästchen. Hier hinüber. So, die Kovarianz ist nun der Durchschnitt aus den entsprechenden Produkten jedes Wertes bis zu seinem Durchschnitt. Hier sehen Sie das, jeder Wert minus den Durchschnitt zweimal, die werden aufsummiert und durch die Anzahl geteilt. Also wird quasi der Durchschnitt berechnet. Der Korrelationskoeffizient berechnet sich nun aus der Kovarianz, das heißt, "=", die Werte nebenan geteilt durch, dann eine Wurzel, Klammer auf, Und jetzt kommen hier meine Varianzen in das Spiel, das mal das, Klammer zu, "Enter". Jetzt sehe ich gerade, da habe ich mich vertippt, ich wollte natürlich geteilt durch machen, sonst würde ich eine Fehlermeldung bekommen. Der Korrelationseffizient beträgt "0,989". Ich sage gleich, was das bedeutet, Oder anders herum, würde ich ihn berechnen hätte ich "=korrel" von welcher Matrix, natürlich die erste Spalte, die Reihenfolge ist egal, Semikolon, zweite Spalte, "Enter", gleicher Wert. Auch für die Kovarianz gibt es eine Funktion, und Sie ahnen es, die heißt natülich "KOVARIANZ". Da gibt es wieder mehrere, eine ältere Version beziehungsweise eine neue. Ich nehme hier die "KOVARIANZ.P" von der Grundgesamtheit, wir sind ja von einer Grundgesamtheit ausgegangen. Nicht die ".S", sondern die ".P". Von welchem Bereich? Von dem hier. Semikolon, zweiter Bereich, natürlich das hier, "Enter". Und Sie sehen "94,055", das ist die gleiche Berechnung. Was sagt jetzt der Korrelationskoeffizient aus? Das ist wohl die wichtigste Frage hier. Wenn der Wert 1 oder fast 1 ist, dann besteht ein starker Zusammenhang. Das heißt, je größer der Mensch, umso schwerer der Mensch. Wenn der Korrelationskoeffizient -1 ist, ist es genau umgekehrt. Je heißer ein Land, umso weniger Wasser gibt es beispielsweise. Wenn der Korrelationskoeffizient 0 ist, also zwischen -1 und 1, hier beispielsweise Größe und Note, da gibt es keinen Zusammenhang. Oder Schuhgröße und Note, dann gibt es eben keinen Zusammenhang. Mit anderen Worten: Der Korrelationskoeffizient schwankt zwischen 1 und -1. -1 heißt umgekehrt reziprok, das heißt, umgekehrter Zusammenhang, je größer A, umso kleiner B. 1 heißt, je größer A, umso größer B. 0 heißt, kein Zusammenhang. Schauen wir uns das mal an. Was passiert mit der Schuhgröße und Note, je größer die Füße, umso besser die Note? Zugegeben, ich habe das natürlich mit Zufallsvariablen erzeugt, aber probieren wir es einfach mal. "=korrel(" von der Spalte, Semikolon und von der Spalte. "0,01", also ein sehr schwacher Zusammenhang. Auf Deutsch, gar keiner. Noch ein Versuch: "=korrel(", wie sieht es aus mit der Größe und der Note, nehmen wir die der zweiten Klassenarbeit. Okay, noch kleiner, also ein noch geringerer Zusammenhang. Ich kann also nicht sagen: je größer, umso besser oder schlechter. Das geht nicht. Das war "Korrelationskoeffizient" und "Kovarianz".

Excel: Statistische Funktionen

Lernen Sie die wichtigsten statistischen Funktionen in Excel kennen und erfahren Sie, was diese eigentlich berechnen und wofür Sie sie verwenden können.

4 Std. 5 min (56 Videos)
Derzeit sind keine Feedbacks vorhanden...
 

Dieser Online-Kurs ist als Download und als Streaming-Video verfügbar. Die gute Nachricht: Sie müssen sich nicht entscheiden - sobald Sie das Training erwerben, erhalten Sie Zugang zu beiden Optionen!

Der Download ermöglicht Ihnen die Offline-Nutzung des Trainings und bietet die Vorteile einer benutzerfreundlichen Abspielumgebung. Wenn Sie an verschiedenen Computern arbeiten, oder nicht den ganzen Kurs auf einmal herunterladen möchten, loggen Sie sich auf dieser Seite ein, um alle Videos des Trainings als Streaming-Video anzusehen.

Wir hoffen, dass Sie viel Freude und Erfolg mit diesem Video-Training haben werden. Falls Sie irgendwelche Fragen haben, zögern Sie nicht uns zu kontaktieren!