Frequenze e Percentuali

BASIC ACCESS - € 3.99

Nell’ambito delle scienze della vita, i dati qualitativi rappresentano la stragrande maggioranza dell’informazione. A differenza di quanto avviene in altri ambiti dove si utilizza una mole significativa di dati quantitativi (e.g., economia), le scienze della vita ed in particolare le discipline in ambito medico fanno uso dei dati qualitativi per descrivere molteplici fenomeni osservati quotidianamente (e.g., stato malattia, severità malattia, forma fisica, abuso sostanze, …). Gestire correttamente questi dati dalla fase di raccolta al momento finale di presentazione rappresenta un focus importante per ogni corso di biostatistica. In questa lezione, vedremo come presentare i dati qualitativi così che l’esposizione sia efficace, completa ed accurata.

In statistica la frequenza è la prima e più semplice modalità di sintesi di un insieme di dati. Si definisce frequenza ogni valore che indica quante volte un determinato evento o un determinato valore sono stati osservati nel campione. Si tratta di una misura derivata dalla semplice attività del contare. In un campione composto da 50 soggetti di cui 30 donne e 20 uomini, i due numeri 30 e 20 prendono nome di frequenze.

Per calcolare le frequenze di una variabile qualitativa in Excel è sufficiente utilizzare la funzione CONTA.SE (o COUNTIF nella versione inglese). La funzione richiede l’indicazione di due argomenti: range di riferimento entro cui trovare i valori e la condizione secondo cui la formula deve scegliere quali valori contare. Data una specifica variabile qualitativa, la funzione conta il numero di celle che riportano la condizione specificata tra parentesi.

Prima di trattare le varie modalità di presentazione delle frequenze in forma tabellare, è necessario introdurre i concetti di esaustività e mutua esclusività dei dati. Il rispetto o meno di questi due principi da parte della variabile di interesse rappresenta un elemento importante nel determinare come costruire la tabella di sintesi dei dati qualitativi e nel precisare quali sono le informazioni necessarie da inserire in tale tabella affinché i risultati presentati siano facilmente comprensibili ad un lettore esterno. Per meglio comprendere i due concetti, supponiamo di lavorare su un dataset composto da 30 soggetti classificati da un test diagnostico come sani o malati (Tabella 1).

Tabella 1 - Dataset

Continue reading...

Please to see full post.

No questions found.

Carrello
  • Il carrello è vuoto.
Index
Torna in alto