Rome University, La Sapienza Chemistry Department Rome, Italy, Europe |
Dr. Giovanni Visco concetto di misura e sua qualita', parametri, problematiche gennaio 2003 |
Corso di Laurea in: Scienze Applicate ai Beni Culturali ed alla Diagnostica per la loro Conservazione Corso di laurea in: Chimica Ambientale |
previous slide, 37 | all lessons, these slides index | next slide, 39 |
Abbiamo capito che il nostro calcolo della distanza e la differenza fra i due valori estremi NON risolve il problema. Ma almeno puo' evidenziare un dato anomalo (detto outlier), oppure uno svarione (detto abbaglio)?
OutliersRiprendiamo il dardo di Uccione che abbiamo aggiunto (colorato in viola) che come si vede bene sul bersaglio e' molto lontano dagli altri. Potrebbe essere un dardo difettoso o un'incertezza da parte dell'armigero, magari e' stato disturbato.
Quando si eseguono misure, reali, puo' succedere di ottenere dati come questo. Nella tabella 4 proviamo ad inserirlo al posto di uno qualsiasi di quell'ultima prova. Decidiamo di sostituire 596-127 con 689-173.
In viola sono state evidenziate le differenze. Si nota che, seppur con i problemi gia' visti nel definire un modello per stimare l'accuratezza ed il vincitore la differenza e' ben visibile.
Il punto, in viola, che abbiamo aggiunto e' definito come outlier. Nelle misure, nel campionamento, nelle regressioni, questi punti sono difficili da individuare ma possono falsare pesantemente i risultati.
Come al solito a lezione: una discussione su quanto si modifica la scala dei vincitori con questo dardo anomalo e qualche considerazione su questo Outlier non poi cosi Out.
Uno degli errori che si compie oggi sempre di piu' e' dovuto alla trascrizione dei dati. Per esempio errori tipografici per cui il numero 12.75% diventa 1.275% oppure 127.5%.
Nel nostro caso simuliamo un errore di trascrizione delle coordinate. Per il terzo set di lanci, per Guidobaldo, in tabella 4, nelle celle P18 et Q18 invertiamo i valori. Il valore esatto sarebbe X=409, Y=100 invece chi ha scritto ha invertito X=100, Y=409. Vediamo nella tabella dei risultati qui sotto cosa avviene.
Questa volta sono evidenziati in azzurro. Di solito questi abbagli sono cosi' evidenti che una divisione o moltiplicazione per dieci come il caso delle virgole precedenti e/o l'inversione di un dato, come in questo caso, provocano un contrasto immediato con gli altri dati.
Ben diverso pero' sarebbe il caso dell'inversione dei due valori in grigio! Non si avrebbe quasi nessuna variazione del risultato con grande difficolta' nel trovare questo svarione.
previous slide, 37 | all lessons, these slides index | next slide, 39 |