Rome University, La Sapienza Chemistry Department Rome, Italy, Europe |
Dr. Giovanni Visco, April 2003 Cenni di statistica. Distribuzioni, Gauss, Student, Beta, ... Parametri: media, mediana, moda, percentili, kurtosi, outlier, ... |
Corso di Laurea in: Scienze Applicate ai Beni Culturali ed alla Diagnostica per la loro Conservazione Corso di laurea in: Chimica Ambientale |
previous slide, 10 | all lessons, these slides index | next slide, 12 |
Riprendiamo la definizione di mediana:
Con questa tecnica, dopo aver ordinato i dati in modo crescente si possono definire i valori che dividono in quattro la distribuzione, dividono in dieci parti la distribuzione, oppure per ogni altro valore percentuale.
Si definiscono quartili e si indicano con Q1, Q2 e Q3 i tre valori che dividono la distribuzione in quattro parti uguali. Il primo 25 % dei dati della distribuzione ha come limite superiore il primo quartile, il 50% dei dati ha come limite il secondo quartile (che e' anche la mediana), e cosi' via.
Decile [decile]Si definiscono decili e si indicano con D1, D2, D3, ... D9 i nove valori che dividono la distribuzione in dieci parti uguali. Il primo 10 % dei dati della distribuzione ha come limite superiore il primo decile, il 50% dei dati ha come limite il quinto decile (che e' anche la mediana), e cosi' via.
Percentile [centile, percentile]Si definiscono percentili e si indicano con P1, P2, P3 ... P99 i novantanove valori che dividono la distribuzione in cento parti uguali. Il primo 5 % dei dati della distribuzione ha come limite superiore il percentile P5, il 50% dei dati ha come limite il percentile P50 (che e' anche la mediana), e cosi' via.
Mediana delle differenze assolute [median of absolute deviations]La differenza media assoluta e il corrispettivo dello scarto quadrativo medio nel dominio dello spazio non parametrico (della moda, della mediana, etc.). Per trovare il valore del MAD si deve:
Per una distribuzione gaussiana esatta con media = 0 e σ = 1 esiste una relazione empirica che collega le due misure della dispersione: σ ~ 1.4826*MAD ed anche MAD/σ ~ 0.6745.
L'ordinamento crescente o decrescente dei dati (da usare con somma attenzione nelle serie temporali) permette pero' di trovare con facilita' questi descrittori, di rappresentare con grafici a barre, di trovare minimo e massimo. Rammentate di applicare tutte le operazioni matematiche solo su una copia del file originale che deve essere percio' riposto in un luogo sicuro e protetto.
Si potrebbero rilevare tutti i dati, classificarli, scrivere un piccolo rapporto esplicativo, ritrovare il piano di campionamento e copiare tutto cio' su di un CD-Rom (non CD-RW) da conservare. Si ottiene cosi' una copia non piu' modificabile utile poi per estrarre un singolo file ed elaborarlo.
previous slide, 10 | all lessons, these slides index | next slide, 12 |