Analisi delle componenti principali
L'analisi delle componenti principali (detta pure trasformata di Karhunen-Loève, KLT o trasformata di Hotelling) è una tecnica per la semplificazione dei dati utilizzata in ambito della statistica multivariata. Per certi versi è simile all'analisi fattoriale.
Lo scopo primario di questa tecnica è la riduzione un numero più o meno elevato di variabili (rappresentanti altrettante caratteristiche del fenomeno analizzato) in alcune variabili latenti.
Ciò avviene tramite una trasformazione lineare delle variabili che proietta quelle originarie in un nuovo sistema cartesiano nel quale la nuova variabile con la maggiore varianza viene proiettata sulla prima asse, la variabile nuova seconda per dimensione della varianza sul secondo asse e così via.
La riduzione della complessità avviene limitandosi ad analizzare le principali (per varianza) tra le nuove variabili.
Diversamente da altre trasformazioni (lineari) di variabili praticate nell'ambito della statistica, in questa tecnica sono gli stessi dati che determinano i vettori di trasformazione.
Assumendo che a ciascuna delle variabili originarie venga sottratta la loro media e pertanto la nuova variabile (Xi) ha media nulla,
Con i primi (k-1) componenti, il k-esimo componente può essere trovato sottraendo i primi (k-1) componenti principali a X
e sostituendo questo
Un metodo più semplice per calcolare la componente wi utilizza la matrice delle covarianze di x. Trovando l'autovalore e l'autovettore della matrice di covarianza, si ottiene che l'autovettore con il maggiore autovalore corrisponde alla dimensione che ha la maggiore correlazione con l'insieme di dati. I dati originali sono infine proiettati nello spazio vettoriale ridotto.
