Rome University, La Sapienza
Chemistry Department
Rome, Italy, Europe
Dr. Giovanni Visco
Cenni di statistica di base. Calcoli di regressioni e correlazioni. novembre 2005
Corso di Laurea in
Scienze Applicate ai Beni Culturali ed alla Diagnostica per la loro Conservazione
previous slide, 17 next slide, 18

Trovato un punto anomalo ora che facciamo?
[having an influential observation point in regression what we can do?

  Ripetiamo un concetto visto prima, "Uno dei problemi della regressione con i minimi quadrati e' che un punto non allineato, detto in inglese Leverage Point, puo' modificare di molto i valori dei parametri di regressione".

  In una slide precedente abbiamo visto qualche metodo per "scoprire" se uno dei punti che devono entrare a far parte del calcolo della regressione e' un punto anomalo, ma ora trovato questo punto cosa dobbiamo fare?.

find the Influential Observation point, so ....

  La risposta non e' univoca, forse potrebbero essere 10 o piu', vediamone alcune dal lato metrologico, chimico analitico, statistico:

  1. svarione od abbaglio, la prima cosa da fare e' controllare il quaderno di laboratorio e vedere se non si tratta di un errore di trasrizione, se e' stata pesata una diversa quantita', se e' stata usata una diversa Gilson per il prelievo. Trovando l'errore sul valore della X o sul valore misurato di Y, e correggendolo, il punto dovrebbe rientrare nella regressione;
  2. eliminazione, del punto anomalo e ricalcolo della distribuzione, ma vediamo piu' avanti le controindicazioni;
  3. nuova misura, ripetere la misura cercando un nuovo valore per la Y, ma anche in questo caso ci sono tante controindicazioni;
  4. riposizionamento, rileggendo il quaderno di laboratorio e ripensando alla procedura si potrebbe riposizionare la X (per esempio in una serie di diluizioni a partire da una soluzione madre potremmo aver dimeticato di settare la Gilson e aver prelevato 2 volte lo stesso volumne ponendolo in 2 matracci diversi);

  Di certo non basta il semplice r2 per controllare a posteriori la "qualita'" della regressione dopo l'intervento sul punto anomalo ma servono un grafico/tabella con i principali stimatori presentati in queste slides.

hippo-c
pregi e difetti

  Qui sopra sono elencati solo alcune delle possibilita' una volta trovato un punto anomalo, vediamo per ognuna pregi e difetti.

  1. svarione od abbaglio, nessun difetto, solo pregi, si evidenzia ancora di piu' la necessita' di una stesura attenta del quaderno di laboratorio (come se fosse una cartella clinica o un quaderno di scavo). E non c'e' neanche troppo da prendersela con se stessi per l'errore, solo chi non fa nulla non sbaglia;
  2. eliminazione, facile da fare ma con vari difetti, fra cui: se il punto e' il primo o l'ultimo della regressione si riduce il range di linearita', se c'e' una giusta equispaziatura fra i valori della X (1, 2, 5, 10 opp. 1, 2, 4, 5, 8, 10) questa viene interrotta, inoltre diminuire il numero dei punti cambia tutti i parametri di regressione per cui bisogna tenerne conto (con correzione?) nel confrontare questa soluzione con le altre;
  3. nuova misura, questa che sembra la soluzione migliore e' la piu' difficile, nel attuarla ci si appoggia sulla ripetibilita' a breve ed a lungo termine, sulla conservazione del campione e degli standard, sulla precisione del metodo. Cosa diversa e' accorgersi dell'errore a fine giornata ed allungare di 1/2 ora la presenza in laboratorio, diverso e' scoprirlo il mese dopo in fase di elaborazione dati. Comunque questa soluzione risolve il riposizionamento della Y non eventuali errori sulla X;
  4. riposizionamento, matematicamente possibile, dopo aver letto la procedura utilizzata nella serie di misure. Non sembra utilizzabile per i punti all'estremo della regressione ma solo per i punti centrali che possono soffrire di qualche errore di "troppa confidenza" con le pratiche di laboratorio. Se attuata vanno usati tutti gli stimatori possibili della regressione per confermarla (e va trovato il perche' questo errore e' avvenuto);

  Comunque dopo uno di questi interventi, o di altri possibili, la regressione va studiata attentamente con i vari stimatori disponibili.

previous slide next slide