Rome University, La Sapienza Chemistry Department Rome, Italy, Europe |
Dr. Giovanni Visco Cenni di statistica di base. Calcoli di regressioni e correlazioni. novembre 2005 |
Corso di Laurea in Scienze Applicate ai Beni Culturali ed alla Diagnostica per la loro Conservazione |
previous slide, 7 (large page > 200KB) | next slide, 9 |
Uno dei problemi che affliggono tutte le regressioni sul piano euclideo e' l'errore associato ai dati sui due assi X ed Y. In questa slide cercheremo di descrivere questo problema, forse senza trovare soluzioni.
Prendiamo uno dei due esempi, reali, visti in precedenza per cercare di descrivere questa problematica. Disegnamo i grafici qui sotto utilizzando solo una zona centrale dell'esempio n.1
solo i punti da studiare | con i punti uniti fra loro |
Scegliamo un errore qualsiasi, la precisione della misura? l'accuratezza della misura? la riproducibilita'? Scelto uno di questi (magari l'accuratezza se si puo') si puo' da ora in poi riferirci a questo quando scriveremo errore.
Si possono ora disegnare tre scenari per gli errori associati ad ognuno dei punti presenti nel grafico. Iniziamo dallo scenario peggiore, l'errore aumenta al diminuire del valore dell'asse X (cioe' nel nostro caso basse concentrazioni=maggior errore, non poi cosi' lontano dalla realta'). Ma per seguire meglio la realta' anche l'errore sulla misura, l'asse Y, aumenta man mano che la misura si fa incerta (misure vicino al L.O.D.=maggior errore, un altro caso non lontano dalla realta').
Come succede spesso nella realta' delle misure i due errori sono indipendenti e il valore assoluto e' diverso per i due assi, in questo esempio l'errore sull'asse Y aumenta piu' rapidamente!
Il grafico potrebbe essere il seguente, con la curva in blu e le barre d'errore dei singoli punti in nero. I dati dell'errore sono scelti, in via ipotetica, per descrivere meglio il problema.
errori con eteroscedasticita' bidimensionale (?&!) |
Gli altri due casi sono opposti fra loro. Nel caso di sinistra l'errore e' presente praticamente solo sull'asse X, per l'altro asse e' trascurabile. Per il caso di destra l'errore e' presente invece solo sull'asse Y e quello sull'asse X e' trascurabile.
errore quasi solo sull'asse X | errore quasi solo sull'asse Y |
Storicamente la chimica analitica e' iniziata con misure di colore e misure elettriche con precisione davvero scarsa, invece le concentrazioni erano molto piu' precise. Bilance a due piatti avevano una risoluzione di 1 mg ed anche i sali ai primi del 1900 erano di discreta purezza. Ecco perche' fino a ieri il grafico di destra era di certo quello che rappresentava meglio la misura analitica.
previous slide (large page > 200KB) | next slide |