Der Korrelationskoeffizient ist dimensionslos und kann Werte von -1 bis 1 einnehmen. Für einen Wert von +1 oder -1 besteht ein vollständiger positiver bzw. negativer linearer Zusammenhang, für einen Wert von 0 ist überhaupt kein linearer Zusammenhang festzustellen.
Je nachdem ob es sich bei den betrachteten Merkmalen um [wiki:Zufallsvariable] oder [wiki:Stichprobe] handelt, spricht man vom Korrelationskoeffizienten <math>\rho_{XY}</math> der [wiki:Grundgesamtheit] zweier [wiki:Zufallsvariable] X und Y und dem [wiki:Stichprobe] r. Die Berechnung ist jedoch praktisch gleich.
Je nachdem ob zwei verschiedene Merkmale oder ein Merkmal mit sich selbst korreliert wird, spricht man von Kreuzkorrelation oder [wiki:Autokorrelation].
Stellt man die Korrelation zweier Messreihen in einem 2-dimensionalen Graphen dar, so ergibt sich für r=+1 oder -1 das Bild einer Geraden.
Für r = -1 fällt diese Gerade. Demnach besteht ein exakter negativer linearer Zusammenhang, also z.B.: je mehr Füchse desto weniger Kaninchen.
Für r = 1 steigt die Gerade und es besteht demnach ein exakter positiver linearer Zusammenhang, also z.B. hängt die Zahl der verwendeten Fahrradreifen linear von der Zahl produzierter Fahrräder ab.
Je näher r an Null liegt, desto weniger besteht ein linearer Zusammenhang.Das heißt aber nicht, das gar kein Zusammenhang besteht, denn den neben dem linearen Zusammenhäng kann auch ein anderer Zusammenhang existieren, der sich nicht mit dem Korrelationskoeffizienten messen lässt.
Der Korrelationskoeffizient ist noch kein Beweis eines ursächlichen Zusammenhangs: Der Rückgang der Besiedlung durch Störche im Süd[wiki:Burgenland] korreliert zwar mit dem dortigen Geburtenrückgang, doch das bedeutet noch lange nicht, dass ein Zusammenhang besteht.
Die Interpretation eines Korrelationskoeffizienten als hoch oder niedrig hängt stark von der Art der korrelierenden Daten ab. Bei psychologischen Fragebogendaten werden häufig Werte bis etwa 0,30 als schwache Korrelation angesehen, während man ab etwa 0,80 von einer sehr hohen Korrelation oder sogar praktisch identischen Variablen ausgeht.
Es existieren genaugenommen mehrere Korrelationskoeffizienten, deren Definition von dem [wiki:Messniveau] der gemessenen Variablen abhängt.
Der Pearson'sche Korrelationskoeffizient (Produkt-Moment-Korrelationskoeffizient) ist vermutlich der bekannteste Korrelationskoeffizient. Er wird deshalb häufig einfach nur als "Korrelationskoeffizient" bezeichnet. Er basiert auf der Annahme [wiki:Intervallskala] Variablen, die [wiki:Bivariat] [wiki:Normalverteilung] sind und kann nach folgender Formel aus [wiki:Kovarianz] (COV) und [wiki:Varianz] (V) zweier [wiki:Zufallsvariable] X und Y berechnet werden:
\rho_{xy} = \frac{COV(X,Y)}{\sqrt{V(X)}\sqrt{V(Y)}} = \frac{\sum_i{(x_i-\bar{x}) (y_i-\bar{y})}}{\sqrt{\sum_i{(x_i-\bar{x})^2}}\sqrt{\sum_i{(y_i-\bar{y})^2}}}</math>
Im Falle von [wiki:Stichprobe] enstprechen die Faktoren im Nenner den [wiki:Standardabweichung].
Auf diesen Koeffizienten wird häufig ausgewichen, wenn erhebliche Zweifel an der Normalverteilung der Variablen bestehen, bspw. im Falle von sehr schiefen Verteilungen. Die Rangkorrelation verlangt lediglich [wiki:Ordinalskala]. Zur Berechnung transformiert man die beobachteten Werte zunächst in fortlaufende Ränge von 1 bis n und setzt die so gewonnenen "Standardrangwerte" in die Formel des Pearson-Koeffizienten (siehe oben) ein.
Ein weiterer rangbasierter Korrelationskoeffizient ist [wiki:Kendalls Tau].
[wiki:Bestimmtheitsmaß], [wiki:Transinformation], [wiki:Kontingenztafel], [wiki:Streudiagramm]
