Rome University, La Sapienza
Chemistry Department
Rome, Italy, Europe
Dr. Giovanni Visco, April 2003
Cenni di statistica. Distribuzioni, Gauss, Student, Beta, ... Parametri: media, mediana, moda, percentili, kurtosi, outlier, ...
Corso di Laurea in: Scienze Applicate ai Beni Culturali ed alla Diagnostica per la loro Conservazione
Corso di laurea in: Chimica Ambientale
previous slide, 16 all lessons, these slides index next slide, 18

Teoria dei piccoli campioni, distribuzione di Student, di Cauchy

  Non potendo sottoporre a misura tutta la popolazione abbiamo gia' visto che si usano disegni di campionamento per ottenere una stima della popolazione stessa. Si usa la teoria dei piccoli campioni per cercare di descrivere al meglio la popolazione partendo dai campioni.

Cauchy distribuzione

  Il matematico Augustin Louis Cauchy (1789-1857) fu il primo a studiare questi problemi ma la descrizione estensiva si deve a Student, pseudonimo di William Sealey Gosset (1876-1937), che nel 1907 e nel 1908, pubblico' due lavori che mostravano come una certa distribuzione di probabilita' (ora chiamata Distribuzione di Student o distribuzione t, ma da lui chiamata z) era utile per stimare la media ed altri parametri di una popolazione che avrebbe una distribuzione Normale ma di cui conosciamo solo un piccolo campione.

  Comunque la distribuzione di Cauchy, precedente, puo' essere considerata una risorsa limite da utilizzare se si dispone di pochi campioni, di solito e' piu' usata quella di Gosset.

light_linea

  William Sealey Gosset aveva ottenuto un impiego come chimico alla Guinness di Dublino nel 1899 come ripiego non essendo riuscito ad ottenere un docenza universitaria (anche per l'eresia delle sue affermazioni sul campionamento). Non essendoci piu' i roghi gli eretici almeno li si cacciava a parolacce. Gosset seguito' nei suoi lavori anzi si dice con profitto potendo studiare con piccoli campioni le materie prime in ingresso. Nei suoi scritti di statistica uso' uno pseudonimo irriverente A. Student (uno studente) con cui e' oggi famoso.

  Comunque bisogna attendere Fisher che capisce e spiega il lavoro di Gosset si dice diventandone anche amico. Ora una delle sue famose formule, quella del caso "independent one-sample t-test" in cui si controlla se la media della popolazione e' uguale alla media μ0 (cioe' a quella "attesa" cioe' ipotizzata con le misure sui campioni).

std error of mean t test t-test, means comparison
standard error of the mean the t formula t-test, mean(s) comparison

  Sono tutte calcolate per un piccolo campione proveniente da una dominio di studio in cui la popolazione e' tutta misurabile. Nelle formule usiamo:

  Vi sono tutta una serie di condizioni di validita', la prima fra tutte e che non conoscendo la vera distribuzione della popolazione ma solo la sua media μ dobbiamo ipotizzare che questa sia data dalla distribuzione di Gauss. Ora -t- in qualche modo misura la "deformazione" del nostro set di dati rispetto ad una gaussiana.

  N-1 e' da Gosset definito gradi di liberta'. I gradi di liberta' misurano quante variabili sono rimaste dopo aver fissato i parametri della distribuzione. La dispersione e' percio' legata per mezzo di tabelle ai gradi di liberta'. Provate a leggere la definizione di gradi di liberta' (e non solo) in questo glossario, Univ. di Torino.

Student formula2

  Nella formula, che utilizza la t gia' vista, Y e' il valore della distribuzione al variare di t. Il valore di ni (N-1, nel caso di distribuzione di x) e' appunto i gradi di liberta'.

Student distribuzione

  La figura precedente e' estratta da: A. Student, The Probable Error Of A Mean, Biometrika, 6(1), 1908, pp. 1-25. Come si nota la t di Student ha una forma a campana come la gaussiana, ma con code piu' pronunciate per piccoli valori di ni. Giusto come esempio nella slide seguente usiamo uno dei tanti possibili t-test applicandolo ad uno dei nostri campionamenti: 13 misure su di una popolazione di 127, una di queste sembra anomala.

light_linea

  Sono almeno 4 i t-test che si usano e su cui la confusione regna sovrana. Senza lo studio attento di queste slide ed ancor di piu' di quelle sulla correlazione non riusciremo a fare chiarezza (speriamo!).

  Gia' rileggendo questo testo mi sembra ci sia confusione fra μ0 et μ ma vedremo a lezione.

previous slide, 16 all lessons, these slides index next slide, 18