Rome University, La Sapienza
Chemistry Department
Rome, Italy, Europe
Dr. Giovanni Visco, April 2003
Cenni di statistica. Distribuzioni, Gauss, Student, Beta, ... Parametri: media, mediana, moda, percentili, kurtosi, outlier, ...
Corso di Laurea in: Scienze Applicate ai Beni Culturali ed alla Diagnostica per la loro Conservazione
Corso di laurea in: Chimica Ambientale
previous slide, 12 all lessons, these slides index next slide, 13

Riproducibilita'
uso dei descrittori per una sua stima [reproducibility, examples]

  Al termine della prime serie di slide che descrivono i descrittori di una distribuzione, il suo valore centrale e la dispersione, proviamo ad usarne un paio per un caso reale. Usiamo sia la media aritmetica, sia la deviazione standard, cioe' arithmetic mean and root mean square deviation.

  Di certo esistono esempi per il settore dei Beni Culturali ma trovarne/inventarne uno per il settore della chimica analitica forense applicata al Food e' molto piu' facile, qui di seguito.

from paper of Jamshid Salamzadeh et al.
J. Salamzadeh, A. Shakoori, V. Moradi, Occurrence of multiclass pesticide residues in tomato
samples collected from different markets of Iran
, Journal of Environmental Health Science
and Engineering, 2018, 16(1), 55-63
light_linea
Uso dei descrittori di una distribuzione

  Facciamo un esempio, abbiamo una consulenza per difendere in tribunale un produttore di pomodori da una contestazione sullo uso di pesticidi. A parte tutto il resto della consulenza ci soffermiamo su campioni prelevati dal campo e dalla grande distribuzione ipotizzando una contraffazione del marchio.

  Per questo esempio utilizziamo come riferimento i dati e le procedure di un paper qui di seguito citato per cui ringraziamo gli autori: J. Salamzadeh, A. Shakoori, V. Moradi, Occurrence of multiclass pesticide residues in tomato samples collected from different markets of Iran, Journal of Environmental Health Science and Engineering, 2018, 16(1), 55-63.

  Ribadiamo che questa web page non ha nulla a che vedere con l'articolo di J. Salamzadeh et al. ma esso serve solo a citare qualche frase e qualche procedura.

light_linea
Il metodo di estrazione

  Dall'articolo ricopiamo qui una frase: for quantitation of pesticide residues in food matrices and the most used named QuEChERS (Quick, Easy, Cheap, Effective, Rugged and Safe). This technique supplies different polar, semi-polar and non-polar pesticide in food samples. Sample preparation technique in QuEChERS method includes three major steps.

  1. Firstly, blended samples are extracted with acetonitrile,
  2. then magnesium sulfate was added for salting-out partitioning
  3. Finally, matrix molecules are removed using primary secondary amine (PSA) sorbent
  4. Nowadays, combination of the mentioned procedure and liquid and gas chromatography ....
light_linea
Le misure

  Ipotizziamo un campionamento con 5 prelievi direttamente su ognuno dei 5 cassoni di trasporto del pomodoro dal campo al magazzino. Altri 5 prelievi vengono dal confezioni integre acquistate in una grande distribuzione. Non sappiamo quale e' la procedura di campionamento ed analisi del CTU, glielo chiedera' l'avvocato.

  Data la procedura qui sopra descritta otteniamo due valori per il Pencanazole, 92 ng/g dai pomodori del campo e 100 ng/g dai pomodori in commercio.

  Prima di presentarsi in tribunale ora ci si deve chiedere questi 2 valori sono diversi, oppure sono uguali?

light_linea
Grafici, distribuzione, riproducibilita'

  Dobbiamo disegnare qualche grafico per poter rispondere alla quasi stupida domanda precedente, un qualsiasi foglio elettronico va bene. Pero' servono i CRM (certified reference material) sia per i "fitofarmaci" puri, sia se esistono per prodotti contaminati. Volendo insistere se non troviamo un CRM per i pomodori ma bensi' per le patate, polveri liofilizzate, contaminate con queste molecole li possiamo usare?

std.dev within-between
example of calculation of WithIn and Between standard deviation
light_linea
Standar Deviation WithIn and Between (WithOut)

  From Minitab software web page:

  Prendiamo la coppia di punti in basso del grafico precedente, in nero, i valori sono diversi, ma inutili, nessun referee, nessun committente oggi accetterebbe dei numeri come questi senza un intervallo di errore.

  Ricordando tutte le slide precedenti, ricordando la citazione qui sopra dei CRM l'errore da associare alle misure sarebbe l'accuratezza, ma come abbiamo gia' detto questo e' un caso difficile, e poi noi ancora non abbiamo ancora firmato i nostri risultati, proviamo ad usare solo la deviazione standard e vediamo che succede.

  Vediamo caso per caso, partendo dal basso del grafico qui sopra, la Y ci serve solo per non sovrapporre i punti:

  1. punti in nero, valore della Y=1, inutili senza una qualche stima dell'errore associato
  2. punti in viola, valore della Y=2, graficando anche il valore della deviazione standard di almeno 5 misure con il GC otteniamo qualcosa di presentabile
  3. punti in verde, valore della Y=3, ripetiamo 5 estrazioni dallo stesso campione con conseguente iniezione ed ecco i risultati della std.dev. graficati
  4. punti in turchese, valore della Y=4, ma se prendiamo i pomodori da 5 diversi cassoni (e cassette in vendita), per ognuno svolgiamo la estrazione e l'estratto lo iniettiamo otteniamo per la std.dev. questo grafico!

  Nel caso dei punto in viola, b), i due risultati sembrano davvero differenti ma stiamo misurando solo la riproducibilita' di un moderno GC che con qualche attenzione e' forse anche migliore. I punti in verde, c), ci dicono che il metodo di estrazione e' soggetto ad una forte variabilita' e la riproducibilita' gia' ci pone problemi a definire come diversi i 2 risultati. Le barre di errore dei punti in turchese, d), ci dicono che NON possiamo definire come diversi i 2 valori ottenuti visto che quasi si sovrappongono.

  Anzi gia' i punti in verde sono ben sovrapposti visto che stiamo usando σ e non 3x σ che e' il limite uniformemente accettato per la distribuzione gaussiana.

  O si trova un diverso metodo/procedura che migliori la riproducibilita' (riducendo la dispersione almeno nel passaggio piu' critico, vedi slide sugli errori) oppure i 2 risultati sono dato il grafico precedente ..... uguali.

light_linea
Discussione dei risultati

  Dimenticate i pomodori e pensate a misure di colore su di una statua del Wiligelmo (forse uno dei primi a firmare le proprie opere in Italia) in cui dovete rimuovere macchie di rame ed utilizzate misure colorimetriche per analizzare il procedere della pulitura.

  Di certo dovreste svolgere varie misure di colore su di un punto prima della pulitura e vi troverete nel caso qui sopra. Vi ritroverete con queste possibilita':

  1. punti in nero, una sola misura su di un punto della macchia prima della pulitura ed una dopo (anche solo statisticamente saranno diverse)
  2. punti in viola, scelto un punto si fissa il colorimetro e si svolgono piu' misure prima e dopo la pulitura (stiamo misurando la riproducibilita' dello strumento)
  3. punti in verde, dopo la scelta di un punto significativo si fa una misura, si allontana e riposiziona lo strumento per n. ottenendo la std.dev. del grafico precedente
  4. punti in turchese, non un solo punto, ripetiamo la misura come in c) su piu' punti ed otteniamo un grafico come quello mostrato.

  Finalmente abbiamo un risultato per la riproducibilita' del metodo usando qualche descrittore della distribuzione, purtroppo i due risultati NON sono diversi.

  Note a margine: abbiamo ipotizzato che il noise non cancelli una qualche forma di distribuzione, che le 2 distribuzioni siano gaussiane, che abbiano Skew=0, che siano omoscedastiche ed anche che siano uguali fra loro (magari solo dopo la pulitura una e' gaussiana). Oppure dovremmo usare un qualche test non-parametrico.

light_linea
Reference, and Anova

  Quando si parla di varianza all'interno di un gruppo e fra i gruppi un collega statistico o matematico pensa subito ad Anova, ed ha ragione, ecco 3 riferimenti, slide di lezione.

  University os Sussex, UK, Analysis of Variance: repeated measures by Graham Hole.

  University of Wisconsin, USA, Analysis of Variance by Bret Hanlon, Bret Larget.

  Calvin University, USA, ANOVA: Analysis of Variation, Math 143 Lecture by R. Pruim.

previous slide, 12 all lessons, these slides index next slide, 13