Q di Yule
La variabile di test Q di Yule è un indice di associazione usato in tabelle statistiche dette di contingenza 2x2
Un indicatore derivato dallo stesso autore è la Y di Yule. Rispetto quest'ultima il valore assoluto è sempre maggiore (|Q| > |Y|) a meno che non vi sia indipendenza o completa associazione.
Metodologia
- Q = (α-1) / (α+1)
ove
- α = (P11/P21) / (P12/P22) è il cosiddetto odds ratio
- Pij = P(AiBj) ove sia i che j assumono i valori 1 e 2
Tale indice Q varia tra -1 e +1, ove 0 indica l'indipendenza.
Q può essere stimato da
- q = (a-1) / (a+1)
dove in questo caso
- a = (f11/f21) / (f12/f22) in analogia a α (con il vincolo che fij sia sempre maggiore di zero
mentre la varianza di q viene stimata con
- s²(q) = 1/4 (1-q)² ΣiΣj1/fij
Esempio
Valori assoluti +-------------+-------+------+ | \ Abile | Si | No | |Sesso \ | | | +-------------+-------+------+ |Uomini | 20 | 80 | |Donne | 90 | 80 | +-------------+-------+------+ Valori relativi (f) +-------------+-------+------+ | \ Abile | Si | No | |Sesso \ | | | +-------------+-------+------+ |Uomini | 0,074 | 0,296| |Donne | 0,333 | 0,296| +-------------+-------+------+
- a = (0,074 / 0,333) / (0,296 / 0,296) = 0,222
- q = (0,222-1)/(0,222+1) = -0,636
Bisogna però fare attenzione quando si collassa una tabella NxN in quanto il criterio di aggregazione dei valori può portare a valori di q diversi.
Se per esempio i dati di partenza fossero stati
+-------------+-------+------+------+ | \ Abile | Si | boh! | No | |Sesso \ | | | | +-------------+-------+------+------+ |Uomini | 20 | 10 | 70 | |Donne | 90 | 0 | 80 | +-------------+-------+------+------+
assegnando il "boh!" ai "No" si ottiene la tabelle e il q=-0,636 di cui sopra, mentre se lo si assegna ai "Si" si ottiene la tabella seguente
+-------------+-------+------+ | \ Abile | Si | No | |Sesso \ | | | +-------------+-------+------+ |Uomini | 30 | 70 | |Donne | 90 | 80 | +-------------+-------+------+
con l'indicatore q che si "attenua" diventando q=-0,448
Storia
George Udny Yule presentò tale indice nell'articolo "On the association of attributes in statistics" (pubblicato nel 1900 in Philosophical Transactions of the Royal Society of London). Questo indice è al centro della controversia Pearson-Yule. Venne contestato tra l'altro da Karl Pearson per il fatto che "collassando" una tabelle NxN riducendola a 2x2, si ottengono risultati differenti a seconda di come vengono aggregati i valori. Questa avvertenza vale tutt'ora (come mostrato dall'esempio precedente) mentre il vero centro della polemica riguardava concetti astratti come il fatto se alla base di una tabella di contingenza ci stia un fenomeno continuo e gaussiano (posizione di Karl Pearson) o un fenomeno discreto (posizione di George Udny Yule, che considerava poco scientifico fare ipotesi non desiderate e non verificabili).
Categoria:Statistica
