Rome University, La Sapienza Chemistry Department Rome, Italy, Europe |
Dr. Giovanni Visco Cenni di statistica di base. Calcoli di regressioni e correlazioni. gennaio 2006 |
Corso di Laurea in Scienze Applicate ai Beni Culturali ed alla Diagnostica per la loro Conservazione |
previous slide, 22 |
|
next slide, 24 |
Quale scala per X ed Y? [what scale for X and Y?]
Prima di tentare ogni correlazione bisogna almeno conoscere quante scale di misura esistono, se e come si puo' passare da una all'altra, se si puo' applicare qualche calcolo statistico su queste scale.
Iniziamo con qualche definizione:
- scala binaria [binary scale, also called binary attribute]: come dice il nome stesso e' fatta da due soli valori, vero/falso, aperto/chiuso. E' davvero complesso inserire queste variabili in un trattamento statistico a meno che non sia un attributo di gruppo. Di solito non ha un "verso" ma per esempio nel caso malato/sano si puo' definire come un indicatore di qualita';
- scala nominale [nominal scale, also called attribute variables or categorical variables]: la scala nominale e' quella piu' debole per un trattamento statistico. E' usata quando la sola informazione disponibile sull'oggetto e' la sua appartenenza ad un gruppo (malato/sano/incognito, presente/non-presente/incerto, pineta/faggeta/castagneto/pioppeto, nuvoloso/coperto/sereno, lanceolata/aghiforme/ecc.). La misura dell'oggetto e' proprio il nome della classe. Un sottoinsieme di questa classe e' la scala Binaria, (vero/falso, si/no) vista prima. Di solto in questa classe non esiste un oggetto maggiore, per definizione sono tutti allo stesso livello, in chemiometria spesso questa classe definisce una proprieta' dell'oggetto. Qualche volta sentirete definirle come variabili categoriche;
- scala ordinale [ordinal scale, also called ranked variables or ordinal variables]: la scala prevede una gradazione al suo interno, cioe' dei livelli, si possono percio' definire parametri di qualita' (scarso/raro/comune/abbondante, ecc.) come spesso avviene nel campionamento da Sensory Panel (qualche volta chiamati Panel Test). Non si possono definire distanze fra gli oggetti ma solo posizioni reciproche, ritornando al sensory panel di un olio d'oliva gli assaggiatori possono avere una tabella "acidita'" con cinque valori crescenti, ogni assaggiatore soggettivamente definisce la sua distanza fra 2 et 3. La trattazione statistica puo' poi utilizzare la posizione degli oggetti in questa scala ordinale. Questa scala e' anche definita .. a punteggio;
- scala ordinale seriale [serial scale]: e' una scala ordinale in cui pero' i valori sono equispaziati, la loro distanza e' costante. E' spesso confusa con la scala ordinale, anzi peggio, si da per scontato che una scala ordinale sia anche seriale! Per chi elabora i dati sarebbe bello che la distanza fra un 30 ed un 26 nei voti di un esame sia la stessa di quella fra un 19 ed un 23.
- scala ad intervallo [interval scale]: ha le stesse proprieta' della scala ordinale, sono pero' definiti gli intervalli fra i valori, la risoluzione, bisogna fare attenzione a sommare e sottrarre questi valori. Forse qualche esempio puo' chiarire, le date ed il tempo associato sono scale ad intervallo, i valori possono anche essere negativi come la temperatura in gradi Celsius;
- scala a rapporti [ratio scale or ratio variables]: le variabili sono quantitative ed hanno riferimento al mondo reale, come la temperatura in gradi Kelvin, sono tutte definite dal S.I., sono possibili tutte le trasformazioni matematiche ed esistono relazioni di trasformazione fra i valori misurati (per esempio da PSI a KPa). Sono quelle che, potendo, dovrebbero essere utilizzate per tutte le misure. E' anche nominata come scala razionale.
Facciamo qualche considerazione cosi' da chiarire meglio cosa sono e dove sono utilizzate normalmente.
- che legame c'e' fra queste scale e la definizione di grandezza intensiva ed estensiva (bulk property and extensive properties)?
- non si puo' definire una distanza fra i valori di una scala nominale, la foglia lanceolata e' piu' vicina alla foglia palmata, a quella aghiforme o a quella ...?
- e' vero che nelle scale ad intervallo la somma non e' possibile, due liquidi a due diverse temperature se miscelati sommano i loro valori?
- nella scala ordinale non e' detto che il massimo o il minimo siano effettivamente quelli riportati, non e' inoltre detto che ripetendo le misure si ottenga lo stesso ordine specie con una altro sensory panel.
La prima parte di questo famoso tutorial e' sulle scale e sulle variabili, poi continua con argomenti che tratteremo in seguito.