Q di Yule

La variabile di test Q di Yule è un indice di associazione usato in tabelle statistiche dette di contingenza 2x2

Un indicatore derivato dallo stesso autore è la Y di Yule. Rispetto quest'ultima il valore assoluto è sempre maggiore (|Q| > |Y|) a meno che non vi sia indipendenza o completa associazione.

Metodologia

Q = (α-1) / (α+1)

ove

α = (P11/P21) / (P12/P22) è il cosiddetto odds ratio
Pij = P(AiBj) ove sia i che j assumono i valori 1 e 2

Tale indice Q varia tra -1 e +1, ove 0 indica l'indipendenza.

Q può essere stimato da

q = (a-1) / (a+1)

dove in questo caso

a = (f11/f21) / (f12/f22) in analogia a α (con il vincolo che fij sia sempre maggiore di zero

mentre la varianza di q viene stimata con

s²(q) = 1/4 (1-q)² ΣiΣj1/fij

Esempio

  Valori assoluti
  +-------------+-------+------+
  |     \ Abile |   Si  |  No  |
  |Sesso \      |       |      |
  +-------------+-------+------+
  |Uomini       |  20   |  80  |
  |Donne        |  90   |  80  |
  +-------------+-------+------+
 
  Valori relativi (f)
  +-------------+-------+------+
  |     \ Abile |   Si  |  No  |
  |Sesso \      |       |      |
  +-------------+-------+------+
  |Uomini       | 0,074 | 0,296|
  |Donne        | 0,333 | 0,296|
  +-------------+-------+------+
 
a = (0,074 / 0,333) / (0,296 / 0,296) = 0,222
q = (0,222-1)/(0,222+1) = -0,636

Bisogna però fare attenzione quando si collassa una tabella NxN in quanto il criterio di aggregazione dei valori può portare a valori di q diversi.

Se per esempio i dati di partenza fossero stati

 
  +-------------+-------+------+------+
  |     \ Abile |   Si  | boh! |  No  |
  |Sesso \      |       |      |      |
  +-------------+-------+------+------+
  |Uomini       |  20   |  10  |  70  |
  |Donne        |  90   |   0  |  80  |
  +-------------+-------+------+------+
 

assegnando il "boh!" ai "No" si ottiene la tabelle e il q=-0,636 di cui sopra, mentre se lo si assegna ai "Si" si ottiene la tabella seguente

  +-------------+-------+------+
  |     \ Abile |   Si  |  No  |
  |Sesso \      |       |      |
  +-------------+-------+------+
  |Uomini       |  30   |  70  |
  |Donne        |  90   |  80  |
  +-------------+-------+------+
 

con l'indicatore q che si "attenua" diventando q=-0,448

Storia

George Udny Yule presentò tale indice nell'articolo "On the association of attributes in statistics" (pubblicato nel 1900 in Philosophical Transactions of the Royal Society of London). Questo indice è al centro della controversia Pearson-Yule. Venne contestato tra l'altro da Karl Pearson per il fatto che "collassando" una tabelle NxN riducendola a 2x2, si ottengono risultati differenti a seconda di come vengono aggregati i valori. Questa avvertenza vale tutt'ora (come mostrato dall'esempio precedente) mentre il vero centro della polemica riguardava concetti astratti come il fatto se alla base di una tabella di contingenza ci stia un fenomeno continuo e gaussiano (posizione di Karl Pearson) o un fenomeno discreto (posizione di George Udny Yule, che considerava poco scientifico fare ipotesi non desiderate e non verificabili).


Categoria:Statistica

See also: Q di Yule, 1900, George Udny Yule, Karl Pearson, Varianza, Y di Yule, Controversia Pearson-Yule, Tabella di contingenza