Rome University, La Sapienza Chemistry Department Rome, Italy, Europe |
Dr. Giovanni Visco, April 2003 Cenni di statistica. Distribuzioni, Gauss, Student, Beta, ... Parametri: media, mediana, moda, percentili, kurtosi, outlier, ... |
Corso di Laurea in: Scienze Applicate ai Beni Culturali ed alla Diagnostica per la loro Conservazione Corso di laurea in: Chimica Ambientale |
previous slide, 12 | all lessons, these slides index | next slide, 13 |
Al termine della prime serie di slide che descrivono i descrittori di una distribuzione, il suo valore centrale e la dispersione, proviamo ad usarne un paio per un caso reale. Usiamo sia la media aritmetica, sia la deviazione standard, cioe' arithmetic mean and root mean square deviation.
Di certo esistono esempi per il settore dei Beni Culturali ma trovarne/inventarne uno per il settore della chimica analitica forense applicata al Food e' molto piu' facile, qui di seguito.
J. Salamzadeh, A. Shakoori, V. Moradi, Occurrence of multiclass pesticide residues in tomato samples collected from different markets of Iran, Journal of Environmental Health Science and Engineering, 2018, 16(1), 55-63 |
Facciamo un esempio, abbiamo una consulenza per difendere in tribunale un produttore di pomodori da una contestazione sullo uso di pesticidi. A parte tutto il resto della consulenza ci soffermiamo su campioni prelevati dal campo e dalla grande distribuzione ipotizzando una contraffazione del marchio.
Per questo esempio utilizziamo come riferimento i dati e le procedure di un paper qui di seguito citato per cui ringraziamo gli autori: J. Salamzadeh, A. Shakoori, V. Moradi, Occurrence of multiclass pesticide residues in tomato samples collected from different markets of Iran, Journal of Environmental Health Science and Engineering, 2018, 16(1), 55-63.
Ribadiamo che questa web page non ha nulla a che vedere con l'articolo di J. Salamzadeh et al. ma esso serve solo a citare qualche frase e qualche procedura.
Dall'articolo ricopiamo qui una frase: for quantitation of pesticide residues in food matrices and the most used named QuEChERS (Quick, Easy, Cheap, Effective, Rugged and Safe). This technique supplies different polar, semi-polar and non-polar pesticide in food samples. Sample preparation technique in QuEChERS method includes three major steps.
Ipotizziamo un campionamento con 5 prelievi direttamente su ognuno dei 5 cassoni di trasporto del pomodoro dal campo al magazzino. Altri 5 prelievi vengono dal confezioni integre acquistate in una grande distribuzione. Non sappiamo quale e' la procedura di campionamento ed analisi del CTU, glielo chiedera' l'avvocato.
Data la procedura qui sopra descritta otteniamo due valori per il Pencanazole, 92 ng/g dai pomodori del campo e 100 ng/g dai pomodori in commercio.
Prima di presentarsi in tribunale ora ci si deve chiedere questi 2 valori sono diversi, oppure sono uguali?
Dobbiamo disegnare qualche grafico per poter rispondere alla quasi stupida domanda precedente, un qualsiasi foglio elettronico va bene. Pero' servono i CRM (certified reference material) sia per i "fitofarmaci" puri, sia se esistono per prodotti contaminati. Volendo insistere se non troviamo un CRM per i pomodori ma bensi' per le patate, polveri liofilizzate, contaminate con queste molecole li possiamo usare?
example of calculation of WithIn and Between standard deviation |
From Minitab software web page:
Prendiamo la coppia di punti in basso del grafico precedente, in nero, i valori sono diversi, ma inutili, nessun referee, nessun committente oggi accetterebbe dei numeri come questi senza un intervallo di errore.
Ricordando tutte le slide precedenti, ricordando la citazione qui sopra dei CRM l'errore da associare alle misure sarebbe l'accuratezza, ma come abbiamo gia' detto questo e' un caso difficile, e poi noi ancora non abbiamo ancora firmato i nostri risultati, proviamo ad usare solo la deviazione standard e vediamo che succede.
Vediamo caso per caso, partendo dal basso del grafico qui sopra, la Y ci serve solo per non sovrapporre i punti:
Nel caso dei punto in viola, b), i due risultati sembrano davvero differenti ma stiamo misurando solo la riproducibilita' di un moderno GC che con qualche attenzione e' forse anche migliore. I punti in verde, c), ci dicono che il metodo di estrazione e' soggetto ad una forte variabilita' e la riproducibilita' gia' ci pone problemi a definire come diversi i 2 risultati. Le barre di errore dei punti in turchese, d), ci dicono che NON possiamo definire come diversi i 2 valori ottenuti visto che quasi si sovrappongono.
Anzi gia' i punti in verde sono ben sovrapposti visto che stiamo usando σ e non 3x σ che e' il limite uniformemente accettato per la distribuzione gaussiana.
O si trova un diverso metodo/procedura che migliori la riproducibilita' (riducendo la dispersione almeno nel passaggio piu' critico, vedi slide sugli errori) oppure i 2 risultati sono dato il grafico precedente ..... uguali.
Dimenticate i pomodori e pensate a misure di colore su di una statua del Wiligelmo (forse uno dei primi a firmare le proprie opere in Italia) in cui dovete rimuovere macchie di rame ed utilizzate misure colorimetriche per analizzare il procedere della pulitura.
Di certo dovreste svolgere varie misure di colore su di un punto prima della pulitura e vi troverete nel caso qui sopra. Vi ritroverete con queste possibilita':
Finalmente abbiamo un risultato per la riproducibilita' del metodo usando qualche descrittore della distribuzione, purtroppo i due risultati NON sono diversi.
Note a margine: abbiamo ipotizzato che il noise non cancelli una qualche forma di distribuzione, che le 2 distribuzioni siano gaussiane, che abbiano Skew=0, che siano omoscedastiche ed anche che siano uguali fra loro (magari solo dopo la pulitura una e' gaussiana). Oppure dovremmo usare un qualche test non-parametrico.
Quando si parla di varianza all'interno di un gruppo e fra i gruppi un collega statistico o matematico pensa subito ad Anova, ed ha ragione, ecco 3 riferimenti, slide di lezione.
University os Sussex, UK, Analysis of Variance: repeated measures by Graham Hole.
University of Wisconsin, USA, Analysis of Variance by Bret Hanlon, Bret Larget.
Calvin University, USA, ANOVA: Analysis of Variation, Math 143 Lecture by R. Pruim.
previous slide, 12 | all lessons, these slides index | next slide, 13 |