Indice di correlazione di Pearson

Il coefficiente di correlazione (lineare) di Pearson tra due variabili aleatorie o due variabili statistiche X e Y è definito come la loro covarianza divisa per il prodotto delle deviazioni standard delle due variabili:

\rho_{xy} = \frac{\sigma_{xy}}{\sigma_x \sigma_y}.

dove

σxy , è la covarianza tra X e Y
σxy , sono le due deviazioni standard

Il coefficiente assume valori compresi tra -1 e +1.

Nel caso di indipendenza lineare il coefficiente assume valore zero, mentre non vale la conclusione oppposta, ovvero dal coefficiente nullo non si può desumere l'indipenenza lineare.

Valori prossimi a +1 (o -1) possono essere misurati anche in presenza di relazioni non lineari. P.es. la seguente relazione quadratica (yi=xi²)

X: 1  2  3   4
 Y: 1  4  9  16
 

produce un coefficiente pari a 0,9844.

Valori positivi venon misurati in presenza di correlazione lineare positiva (p.es.: y=a+bx, dove b>0), mentre valori negativi vengono misurati in presenza di correlazione lineare negativa (p.es.: y=a+bx, con b<0).

Articoli correlati

See also: Indice di correlazione di Pearson, Correlazione, Covarianza, Deviazione standard, Francis Galton, Karl Pearson, Regressione lineare, Variabile casuale