Rome University, La Sapienza Chemistry Department Rome, Italy, Europe |
Dr. Giovanni Visco Cenni di statistica di base. Calcoli di regressioni e correlazioni dicembre 2006 |
Corso di Laurea in: Scienze Applicate ai Beni Culturali ed alla Diagnostica per la loro Conservazione Corso di laurea in: Chimica Ambientale |
previous slide, 27 | all lessons, these slides index | next slide, 29 |
Anche Wilcoxon e' un test non parametrico (Frank Wilcoxon (1892-1965)) che viene utilizzato per confrontare due serie di misure effettuate sugli stessi oggetti. Si possono confrontare due strumenti di misura, due procedure analitiche, due operatori, ecc. .
La confusione regna sovrana*, leggendo i libri di Wilcoxon test veramente ne esistono tre: il Wilcoxon Two Sample Test meno usato e non descritto qui, il Wilcoxon Signed Rank Sum Test qui descritto, ma anche il Wilcoxon Matched-Pairs Test.
Bisogna far attenzione che gli oggetti siano davvero gli stessi, se si tratta di campioni ogni singolo deve essere diviso in due e poi sottoposto ad indagine, separatamente. La teoria percio' ne impedirebbe un uso clinico a meno di non sottoporre lo stesso paziente a due trattamenti (con due antidolorifici?) in tempi diversi ma viene meno il parallelismo dell'azione di misura.
Questo test puo' essere utilizzato con variabili almeno Ordinali, ma anche per distribuzioni abbastanza diverse dalla Gaussiana.
Provetta n. | 8 | 10 | 5 | 1 | 9 | 3 | 7 | 6 | 11 | 2 | 4 |
Valeria, micrometro n.1 | 14.68 | 14.72 | 14.72 | 14.73 | 14.73 | 14.74 | 14.74 | 14.75 | 14.75 | 14.78 | 14.85 |
Marianna, micrometro n.2 | 14.78 | 14.77 | 14.76 | 14.72 | 14.73 | 14.81 | 14.71 | 14.80 | 14.81 | 14.77 | 14.79 |
Vincenzo, micrometro n.1 | 14.68 | 14.63 | 14.64 | 14.66 | 14.67 | 14.64 | 14.70 | 14.67 | 14.72 | 14.68 | 14.76 |
Il data set necessita di una descrizione per capire a cosa si applica il test. Gli oggetti sono le famose provette da centrifuga e misuriamo il diametro a 10 mm dal fondo con un micrometro che fornisce una risoluzione di 0.01 mm. Abbiamo a disposizione due micrometri e tre studenti come si vede dalla tabella qui sopra. Stiamo percio' testando la variabilita' sperimentale dovuta allo strumento. Nel nostro esempio possiamo anche testare la variabilita' dovuta all'operatore.
Definizioni:
Gli altri due:
Ricapitoliamo, abbiamo 2 strumenti-metodi-operatori-procedure che applichiamo ad n oggetti ed otteniamo 2n misure. Il test e' normalmente definito con la sigla " T-test " e qui ipotizziamo che NON ci sia differenza fra i due strumenti.
|
Calcoli: Il calcolo inizia con la messa in ordine crescente degli oggetti attraverso il loro numero identificativo. Poi per l'oggetto n. si calcola la differenza, con il segno, fra i due valori misurati. Si procede con il calcolo del valore assoluto della differenza. Si procede con l'oggetto n.2 e cosi' via fino all'ultimo oggetto. Il rank si trova mettendo in ordine crescente il valore assoluto delle differenze ma non contando i valori con diff=0. Finalmente si riporta al rank calcolato il segno della differenza. Bisogna porre attenzione ai Tied Ranks cioe' ai dati numerici che hanno lo stesso valore. Come vedete questi si dividono la posizione da loro occupata in modo che ogni misura non tragga beneficio dalla posizione. Per ottenere il rank totale si contano tutte le differenze diverse da zero, ndif. Poi si applica la formula qui sotto.
Ora sommiamo tutti i rank positivi, nel nostro caso 4 + 5.5 + 5.5 + 7.5 + 9 + 10 = 41.5 = W + La somma di tutti i rank negativi invece fornisce -1.5 + -1.5 + -3 + -7.5 = -13.5 = W - Il valore complessivo e': W = W + + W - = 41.5 + (-13.5) = 28. Se dovesse venire negativo si riparte dall'inizio ma invertendo i due set di misure. Gia' la diversita' fra i due W mostra la diversita' fra i due metodi-strumenti, ecc.. |
Dalla formula qui sopra calcoliamo il massimo possibile valore di W (oppure di -W), ma quale e' il valore piu' probabile per un numero infinito di prove. Si potrebbe iniziare un processo tedioso con n oggetti di per cui una sola misura e' diversa, poi cambiare n e aumentare le misure con differenze. Gia' fatto grazie. Il valore medio della popolazione di questi possibili valori di W e' µw=0 che e' appunto la null-hypotesis. E' stata anche calcolata la deviazione standard associata a questa ipotetica distribuzione (per n grande) ed e' la seguente.
data µw=0 questa e' la deviazione standard per W |
Ora finalmente possiamo calcolare il parametro T che confronteremo con una tabella per vedere se l'ipotesi nulla e' accettata oppure no. La formula e' la seguente.
spesso T e' invece chiamato Z, questa e' la formula per µw=0 |
Ricapitoliamo: abbiamo ottenuto nel nostro caso un W=28 partendo dall'ipotesi H0 che non esiste differenza fra i due strumenti. Dalla formula qui sopra calcoliamo αW = 19.6. Al fine si calcola T = 1.40 dall'ultima formula. Se scegliamo per α un valore di 0.05 cioe' accettiamo un errore di tipo I del 5%, detto ancora meglio se H0 e' vera noi accettiamo di rifiutarla facendo un errore del 5%.
Una tabella per i valori critici di W e' disponibile sul sito del Dr. Victor L. Bissonnette at Mount Berry. Ancora piu' interessante e' la descrizione di tutto il test di Wilcoxon. Ecco il programma di calcolo OnLine che potete trovare su the "T" test online presso il Vassar College, Poughkeepsie, New York.
non ci interessa se e' la seconda o se e' la prima misura ad essere maggiore o minore percio' utilizzando il test a due code, abbiamo il 16% di probabilita' che H0 sia falsa. (come potevamo vedere dalla diversita' fra W - e W +) |
Il test e' spesso utilizzato anche da chi non lo capisce, una corretta descrizione del test e' fornita dal Prof. Richard B. Darlington alla Cornell University.
* avendo un poco di tempo andro' alla ricerca del lavoro originale e cerchero' di capirci qualche cosa!
previous slide, 27 | all lessons, these slides index | next slide, 29 |