Rome University, La Sapienza
Chemistry Department
Rome, Italy, Europe
Dr. Giovanni Visco, April 2003
Cenni di statistica. Distribuzioni, Gauss, Student, Beta, ... Parametri: media, mediana, moda, percentili, kurtosi, outlier, ...
Corso di Laurea in: Scienze Applicate ai Beni Culturali ed alla Diagnostica per la loro Conservazione
Corso di laurea in: Chimica Ambientale
previous slide, 8 all lessons, these slides index next slide, 10

Misura della dispersione, definizioni, campo di variazione, scostamento medio, ecc.
[spreads, range, mean deviation, root mean square deviation, variance]

  Non appena trovato il valore centrale della distribuzione bisogna definire la dispersione [spread], cioe' quanto i dati siano raggruppati o meno intorno al valore centrale. Quasi tutti questi valori che presenteremo sono definibili in due forme, una per la popolazione ed una per i campioni quando si dispone di un piccolo numero di dati che dovrebbero rappresentare la popolazione. Bisogna fare molta attenzione per capire quale metodo di calcolo usa un foglio elettronico o un programma di statistica prima di sparare risultati a casaccio dei nostri meravigliosi calcoli.

light_linea
Campo di variazione [range]

  Anche definito come intervallo di variazione [range o meglio in francese étendue intervalle], per definirlo bisogna differenziare fra:

  1. Dispersione numericamente definita, magari proveniente da un campionamento, di cui e' nota la numerosita' e si puo' percio' estrarre da essa il valore minimo e massimo, cioe' (campo di variazione)=(valore massimo)-(valore minimo)
  2. Dispersione numericamente indefinita, con la numerosita' ignota oppure definita in via teorica. Non esiste un minimo ed un massimo calcolabili direttamente. Prendiamo per esempio l'altezza degli europei, di tutti gli europei, non e' possibile definire un valore minimo e massimo. In questo caso si ricorre alla probabilita' per definire i limiti (anche intuitivamente [non andate mai per intuizione nella statistica] non sembra possibile che ci sia un europeo alto 3 metri, si saprebbe, ne parlerebbero i giornali, ecc.).
light_linea
Scostamento medio assoluto, [mean deviation, mean absolute error]
scostamento medio

  Lo scostamento medio semplice assoluto (detto anche scarto medio assoluto) [mean absolute error] dalla media aritmetica misura la deviazione intorno alla media. Le barre verticali rappresentano il valore assoluto, cioe' il valore della differenza e' riportato sempre al valore positivo.

light_linea
Scarto quadratico medio [standard deviation, root mean square deviation]
scarto quadratico medio

  E' uno dei valori piu' usati per definire la dispersione di una distribuzione, ne vedete mostrate le due formule per la popolazione e per i piccoli campioni (n < 30, per definizione). Per convenzione si usa sigma per rappresentare lo s.q.m. della popolazione e si usa esse per lo s.q.m. del campione.

  Oltre che come [standard deviation] viene anche definito come [root mean square deviation].

light_linea
Varianza [variance, mean square deviation]
varianza

  Poiche' la varianza e' una quantita' di secondo grado, si preferisce calcolare la sua radice quadrata, che viene chiamata deviazione standard o scarto quadratico medio.

  Si calcola percio' quasi sempre e si riporta come misura della dispersione la mean deviation, la radice quadrata della varianza. Non bisogna pero' sottovalutare la differenza, l'operazione radice quadrata modifica enormemente i valori assoluti {sqrt(0.043)=0.207 , sqrt(2.17)=1.473}.

  Oltre che come [variance] viene anche definito come [mean square deviation].

Intervallo di confidenza [confidence interval]

  E' la probabilita' che una misura cada all'interno dell'intervallo a-b, dipende dalla forma della distribuzione, si puo' matematicamente calcolare sia dai dati sia dalle formule descrittive della distribuzione una volta definiti tutti gli altri parametri.

previous slide, 8 all lessons, these slides index next slide, 10