Correlation Coefficient Spearman Vs Pearson
Korrelationskoeffizient: Spearman vs. Pearson
Der Korrelationskoeffizient misst die Stärke und Richtung einer Beziehung zwischen zwei Variablen. Er gibt an, wie stark zwei Dinge zusammenhängen.
Es gibt verschiedene Arten von Korrelationskoeffizienten. Zwei der häufigsten sind der Spearman-Korrelationskoeffizient und der Pearson-Korrelationskoeffizient. Sie unterscheiden sich darin, was sie messen.
Pearson-Korrelation
Der Pearson-Korrelationskoeffizient misst die lineare Beziehung zwischen zwei Variablen. Das bedeutet, er misst, wie gut die Datenpunkte durch eine gerade Linie beschrieben werden können. Er wird oft einfach als "Korrelation" bezeichnet.
Wann verwenden? Der Pearson-Korrelationskoeffizient ist am besten geeignet, wenn:
- Die Beziehung zwischen den Variablen linear ist.
- Die Variablen metrisch sind (d.h. intervall- oder ratioskaliert). Denken Sie an Alter, Gewicht oder Temperatur.
- Die Daten annähernd normalverteilt sind.
Beispiel: Stellen Sie sich vor, Sie untersuchen den Zusammenhang zwischen der Anzahl der Stunden, die Studierende lernen, und ihren Prüfungsergebnissen. Wenn mehr Lernzeit tendenziell mit höheren Noten einhergeht und dieser Zusammenhang sich durch eine gerade Linie darstellen lässt, ist der Pearson-Korrelationskoeffizient geeignet.
Berechnung: Die Berechnung des Pearson-Korrelationskoeffizienten basiert auf den tatsächlichen Werten der Variablen. Er berücksichtigt den Mittelwert und die Standardabweichung der Daten.
Spearman-Korrelation
Der Spearman-Korrelationskoeffizient misst die monotone Beziehung zwischen zwei Variablen. Das bedeutet, er misst, ob die Variablen tendenziell zusammen steigen oder fallen, auch wenn die Beziehung nicht linear ist. Er basiert auf den Rängen der Daten.
Wann verwenden? Der Spearman-Korrelationskoeffizient ist besser geeignet, wenn:
- Die Beziehung zwischen den Variablen nicht linear ist, aber monoton. Eine monotone Beziehung bedeutet, dass wenn eine Variable steigt, die andere entweder auch steigt oder auch fällt.
- Die Variablen ordinal sind (d.h. Rangdaten). Denken Sie an eine Bewertungsskala von "sehr schlecht" bis "sehr gut".
- Die Daten nicht normalverteilt sind. Er ist robuster gegenüber Ausreißern.
Beispiel: Stellen Sie sich vor, Sie untersuchen den Zusammenhang zwischen der Platzierung eines Läufers in einem Marathon und seiner Leistung, die subjektiv von Richtern bewertet wird. Je besser die Platzierung (niedrigere Zahl), desto besser die Bewertung. Die Beziehung ist wahrscheinlich nicht linear, aber sie ist monoton (bessere Platzierung führt zu besserer Bewertung). Hier ist der Spearman-Korrelationskoeffizient besser geeignet.
Berechnung: Der Spearman-Korrelationskoeffizient wird berechnet, indem die Daten zuerst in Ränge umgewandelt werden. Anstatt die tatsächlichen Werte zu verwenden, werden die Datenpunkte danach geordnet, wie sie im Vergleich zueinander liegen. Er berechnet dann im Grunde den Pearson-Korrelationskoeffizienten auf diesen Rängen.
Der Unterschied in Kürze
Der Hauptunterschied liegt darin, was sie messen:
- Pearson: Lineare Beziehungen zwischen metrischen Variablen.
- Spearman: Monotone Beziehungen zwischen ordinalen oder nicht-normalverteilten Variablen.
Merke: Wählen Sie den Korrelationskoeffizienten, der am besten zu Ihren Daten und der Art der Beziehung passt, die Sie untersuchen möchten. Wenn Sie sich nicht sicher sind, ob die Beziehung linear ist oder ob Ihre Daten normalverteilt sind, ist der Spearman-Korrelationskoeffizient oft eine sicherere Wahl.
Ein Wert nahe +1 bedeutet eine starke positive Korrelation, ein Wert nahe -1 bedeutet eine starke negative Korrelation, und ein Wert nahe 0 bedeutet keine oder eine schwache Korrelation.
