Korrelationen vergleichen: Fisher-Z-Test erklärt

Der Korrelationskoeffizient (oder einfach: Korrelation), 𝜌, ist ein gebräuchliches Maß zur Beschreibung der Stärke des Zusammenhangs zwischen zwei Variablen. Dieser Blogeintrag zeigt, wie man statistisch prüfen kann, ob sich zwei Korrelationen, die jeweils aus einer eigenen Stichprobe stammen, signifikant voneinander unterscheiden.


Bevor wir loslegen, ein paar grundlegende Dinge:

  • 𝜌: der wahre Korrelationskoeffizient in der Population
  • r: der Korrelationswert, der aus einer Stichprobe berechnet wurde
  • Nullhypothese (𝐻₀): 𝜌₁ = 𝜌₂
  • Alternativhypothese (𝐻₁): 𝜌₁ ≠ 𝜌₂ (einseitige Tests sind ebenfalls möglich)

Warum ist die Fisher-z-Transformation überhaupt notwendig?

Unser Ziel ist es, inferenzstatistisch zu prüfen, ob sich zwei Korrelationen signifikant unterscheiden. Dafür müssen bestimmte Voraussetzungen erfüllt sein – eine zentrale davon ist die Normalverteilung der Prüfgröße.

Korrelationen (r) sind jedoch nicht normalverteilt, insbesondere bei kleinen Stichproben oder wenn r weit von null entfernt ist.
Die transformierten z-Werte nach Fisher hingegen sind näherungsweise normalverteilt – und genau das machen wir uns hier zunutze.


Fisher-z-Transformation

Zur Durchführung des Hypothesentests werden die Korrelationswerte r mit folgender Formel transformiert:

zᵢ = (1/2) * log((1 + rᵢ) / (1 - rᵢ))

Anschließend benötigen wir die Standardabweichung der Differenz dieser z-Werte:

σ = sqrt(1 / (N₁ - 3) + 1 / (N₂ - 3))

Die Teststatistik berechnet sich dann wie folgt:

z = (z₁ - z₂) / σ

Dabei gilt:

  • z₁ / z₂: transformierte Werte der Stichprobenkorrelationen
  • z: Teststatistik, die mit der Standardnormalverteilung verglichen wird
    (Achtung: Dieses z ist nicht das Ergebnis der Fisher-Transformation, sondern die Prüfgröße. Etwas unglücklich benannt, aber üblich.)

Interpretation der Ergebnisse

  • Liegt der berechnete z-Wert außerhalb von ±1,96 (kritischer Bereich bei einem Signifikanzniveau von α = 0,05), dann ist das Ergebnis signifikant → Die Korrelationen unterscheiden sich.
  • Liegt der z-Wert innerhalb dieses Bereichs, besteht kein statistisch nachweisbarer Unterschied.

P.S. – Ein praktischer Zusatzhinweis

Da die Korrelation die standardisierte Regressionssteigung zwischen zwei Variablen ist, kann man dieses Verfahren auch nutzen, um zu prüfen, ob zwei Gruppen unterschiedliche Regressionssteigungen aufweisen.

Weiter
Weiter

Vergleich von 2 Datensätzen mit R