Rome University, La Sapienza
Chemistry Department
Rome, Italy, Europe
Dr. Giovanni Visco
Cenni di statistica di base. Calcoli di regressioni e correlazioni
dicembre 2006
Corso di Laurea in: Scienze Applicate ai Beni Culturali ed alla Diagnostica per la loro Conservazione
Corso di laurea in: Chimica Ambientale
previous slide, 27 all lessons, these slides index next slide, 29

Wilcoxon signed rank sum test

  Anche Wilcoxon e' un test non parametrico (Frank Wilcoxon (1892-1965)) che viene utilizzato per confrontare due serie di misure effettuate sugli stessi oggetti. Si possono confrontare due strumenti di misura, due procedure analitiche, due operatori, ecc. .

  La confusione regna sovrana*, leggendo i libri di Wilcoxon test veramente ne esistono tre: il Wilcoxon Two Sample Test meno usato e non descritto qui, il Wilcoxon Signed Rank Sum Test qui descritto, ma anche il Wilcoxon Matched-Pairs Test.

  Bisogna far attenzione che gli oggetti siano davvero gli stessi, se si tratta di campioni ogni singolo deve essere diviso in due e poi sottoposto ad indagine, separatamente. La teoria percio' ne impedirebbe un uso clinico a meno di non sottoporre lo stesso paziente a due trattamenti (con due antidolorifici?) in tempi diversi ma viene meno il parallelismo dell'azione di misura.

  Questo test puo' essere utilizzato con variabili almeno Ordinali, ma anche per distribuzioni abbastanza diverse dalla Gaussiana.

Il data set: studenti del 2005, IV anno, stessi oggetti
Provetta n. 8 10 5 1 9 3 7 6 11 2 4
Valeria, micrometro n.1 14.68 14.72 14.72 14.73 14.73 14.74 14.74 14.75 14.75 14.78 14.85
Marianna, micrometro n.2 14.78 14.77 14.76 14.72 14.73 14.81 14.71 14.80 14.81 14.77 14.79
Vincenzo, micrometro n.1 14.68 14.63 14.64 14.66 14.67 14.64 14.70 14.67 14.72 14.68 14.76

  Il data set necessita di una descrizione per capire a cosa si applica il test. Gli oggetti sono le famose provette da centrifuga e misuriamo il diametro a 10 mm dal fondo con un micrometro che fornisce una risoluzione di 0.01 mm. Abbiamo a disposizione due micrometri e tre studenti come si vede dalla tabella qui sopra. Stiamo percio' testando la variabilita' sperimentale dovuta allo strumento. Nel nostro esempio possiamo anche testare la variabilita' dovuta all'operatore.

Definizioni:

Gli altri due:

  Ricapitoliamo, abbiamo 2 strumenti-metodi-operatori-procedure che applichiamo ad n oggetti ed otteniamo 2n misure. Il test e' normalmente definito con la sigla " T-test " e qui ipotizziamo che NON ci sia differenza fra i due strumenti.

hippo-l
num mis1 mis2 diff rank sign rank
9 14.73 14.73 0.00    
2 14.77 14.78 -0.01 1.5 -1.5
1 14.72 14.73 -0.01 1.5 -1.5
7 14.71 14.74 -0.03 3 -3
5 14.76 14.72 0.04 4 4
10 14.77 14.72 0.05 5.5 5.5
6 14.80 14.75 0.05 5.5 5.5
4 14.79 14.85 -0.06 7.5 -7.5
11 14.81 14.75 0.06 7.5 7.5
3 14.81 14.74 0.07 9 9
8 14.78 14.68 0.10 10 10

Calcoli:

  Il calcolo inizia con la messa in ordine crescente degli oggetti attraverso il loro numero identificativo. Poi per l'oggetto n. si calcola la differenza, con il segno, fra i due valori misurati. Si procede con il calcolo del valore assoluto della differenza. Si procede con l'oggetto n.2 e cosi' via fino all'ultimo oggetto. Il rank si trova mettendo in ordine crescente il valore assoluto delle differenze ma non contando i valori con diff=0. Finalmente si riporta al rank calcolato il segno della differenza.

  Bisogna porre attenzione ai Tied Ranks cioe' ai dati numerici che hanno lo stesso valore. Come vedete questi si dividono la posizione da loro occupata in modo che ogni misura non tragga beneficio dalla posizione.

  Per ottenere il rank totale si contano tutte le differenze diverse da zero, ndif. Poi si applica la formula qui sotto.

rank summ
somma dei rank delle differenze, W=55 per 10 differenze

  Ora sommiamo tutti i rank positivi, nel nostro caso 4 + 5.5 + 5.5 + 7.5 + 9 + 10 = 41.5 = W +

  La somma di tutti i rank negativi invece fornisce -1.5 + -1.5 + -3 + -7.5 = -13.5 = W -

  Il valore complessivo e': W = W + + W - = 41.5 + (-13.5) = 28. Se dovesse venire negativo si riparte dall'inizio ma invertendo i due set di misure.

  Gia' la diversita' fra i due W mostra la diversita' fra i due metodi-strumenti, ecc..

  Dalla formula qui sopra calcoliamo il massimo possibile valore di W (oppure di -W), ma quale e' il valore piu' probabile per un numero infinito di prove. Si potrebbe iniziare un processo tedioso con n oggetti di per cui una sola misura e' diversa, poi cambiare n e aumentare le misure con differenze. Gia' fatto grazie. Il valore medio della popolazione di questi possibili valori di W e' µw=0 che e' appunto la null-hypotesis. E' stata anche calcolata la deviazione standard associata a questa ipotetica distribuzione (per n grande) ed e' la seguente.

std dev per mu=0
data µw=0 questa e' la deviazione standard per W

  Ora finalmente possiamo calcolare il parametro T che confronteremo con una tabella per vedere se l'ipotesi nulla e' accettata oppure no. La formula e' la seguente.

std dev per mu=0
spesso T e' invece chiamato Z, questa e' la formula per µw=0

  Ricapitoliamo: abbiamo ottenuto nel nostro caso un W=28 partendo dall'ipotesi H0 che non esiste differenza fra i due strumenti. Dalla formula qui sopra calcoliamo αW = 19.6. Al fine si calcola T = 1.40 dall'ultima formula. Se scegliamo per α un valore di 0.05 cioe' accettiamo un errore di tipo I del 5%, detto ancora meglio se H0 e' vera noi accettiamo di rifiutarla facendo un errore del 5%.

  Una tabella per i valori critici di W e' disponibile sul sito del Dr. Victor L. Bissonnette at Mount Berry. Ancora piu' interessante e' la descrizione di tutto il test di Wilcoxon. Ecco il programma di calcolo OnLine che potete trovare su the "T" test online presso il Vassar College, Poughkeepsie, New York.

n1=11, n2=11, Wtest
non ci interessa se e' la seconda o se e' la prima misura ad essere
maggiore o minore percio' utilizzando il test a due code,
abbiamo il 16% di probabilita' che H0 sia falsa.
(come potevamo vedere dalla diversita' fra W - e W +)

  Il test e' spesso utilizzato anche da chi non lo capisce, una corretta descrizione del test e' fornita dal Prof. Richard B. Darlington alla Cornell University.

* avendo un poco di tempo andro' alla ricerca del lavoro originale e cerchero' di capirci qualche cosa!

previous slide, 27 all lessons, these slides index next slide, 29