Varianza

In statistica la varianza è un indice di dispersione. Viene solitamente indicata con σ2 (dove σ è la deviazione standard).

La formula di base è:

\sigma^2 =  \frac{1}{n} \sum_{i=1}^n  \left( x_i - \mu \right) ^ 2

dove μ rappresenta la media aritmetica dei valori xi.

Nel caso si tratti di valori ponderati, allora la definizione diventa:

\sigma^2 =  \sum_{j=1}^k f_j (x_j - \mu)^ 2

(in questo caso μ è la media aritmetica ponderata).

La varianza è un indicatore di dispersione in quanto è nulla solo nei casi in cui tutti i valori sono uguali tra di loro (e pertanto uguali alla loro media) e cresce con il crescere delle differenze reciproche dei valori.

Trattandosi di una somma di valori (anche negativi) al quadrato, è evidente che la varianza non sarà mai negativa.

La diseguaglianza di Cebicev garantisce che almeno il 75% dei valori sono compresi tra μ-2σ e μ+2σ e almeno l'88% tra μ-3σ e μ+3σ.

Esempio

Se abbiamo i seguenti cinque valori: -9,-1,+1,+7,+22 ricaviamo che hanno la media

\mu = \frac{-9-1+1+7+22}{5} = \frac{20}{5} = 4\,\!

e la varianza

\sigma^2 = \frac{(-9-4)^2+(-1-4)^2+(1-4)^2+(7-4)^2+(22-4)^2}{5}
= \frac{(-13)^2+(-5)^2+(-3)^2+3^2+18^2}{5}
= \frac{169+25+9+9+324}{5} = \frac{536}{5}
= 107,2\,\!

pertanto la deviazione standard dei suddetti cinque valori è:

\sigma = \sqrt{107,2} \cong 10,35374
    
 

Vedasi pure: covarianza

See also: Varianza, Covarianza, Deviazione standard, Diseguaglianza di Cebicev, Indice di dispersione, Media, Statistica