Dopo aver definito domanda ed ipotesi di ricerca, la creazione del dataset rappresenta il principale strumento di archiviazione dei dati a mano a mano che sono rilevati. Sebbene gli attuali strumenti informatici forniscano un notevole supporto, ciascun dataset deve essere modellato in base allo specifico studio in modo da renderlo di facile interpretazione, riducendo altresì il rischio di errori. La creazione del dataset (dataset = insieme di dati) è uno dei momenti cruciali nel lavoro di preparazione dati e necessita di una grande attenzione. Costruire un dataset in modo errato può comportare notevoli difficoltà durante la successiva fase di elaborazione statistica; in presenza di errori gravi può essere necessario creare un nuovo dataset. Di seguito ecco il metodo più semplice per creare un dataset ordinato e già pronto per la successiva fase di elaborazione.
Impostazione del dataset
In questa lezione:
Primo passo: creare l’elenco delle variabili
Il primo step per creare un buon dataset è costruire l’elenco delle variabili che si intendono includere nello studio. In questa prima fase di pianificazione del lavoro statistico, l’elenco delle variabili deve essere sovrabbondante così da identificare tutti i possibili dati su cui si potrebbe lavorare.
Il risultato finale è quindi un semplice elenco, come quello presentato sotto (Figura 1), in cui sono riportati il nome della variabile per esteso, la sua forma abbreviata (molto utile nel prosieguo del lavoro), una breve descrizione ed i possibili valori (o range di valori) che la variabile può assumere.
Questo elenco può essere creato sia su Word che su Excel. L’elenco serve per dare le indicazioni sulle variabili possibili dello studio e rappresenta uno dei punti di riferimento del lavoro di elaborazione. Per ogni eventuale dubbio interpretativo della variabile, si potrà sempre tornare su questo elenco e controllare le specifiche di ciascuna variabile.
Dopo aver preparato questo elenco, si fa una prima scrematura delle variabili, ossia si identificano quelle necessarie per lo studio e si escludono quelle che sono sovrabbondanti o già incluse nel calcolo di qualche altra variabile.
Se l’elenco include una variabile derivata (e.g., indice di massa corporea – BMI) includi sempre le variabili che partecipano a tale calcolo (e.g., altezza
Continue reading...
Please Login to see full post.