Statistica e probabilità sono due concetti strettamente connessi: il calcolo della probabilità utilizza l’informazione statistica per eseguire previsioni sul futuro sfruttando concettualizzazioni matematiche. Questo processo apparentemente astratto e teorico è continuamente presente nel nostro approccio pratico di prevedere il verificarsi o meno di un evento e ciò indipendentemente dal contesto in cui l’evento stesso ha luogo sia esso scientifico o meno. Il nostro cervello utilizza infatti l’esperienza in tutte le applicazioni quotidiane per eseguire stime più o meno accurate circa i possibili esiti di eventi futuri: esso è in grado di processare le informazioni che provengono dall’esperienza per fare stime probabilistiche in molteplici ambiti.
Nello studio della biostatistica, il connubio statistica-probabilità rappresenta il sostegno concettuale per il passaggio dalla statistica descrittiva alla statistica inferenziale. Esattamente come il cervello utilizza l’esperienza accumulata per prevedere l’esito di eventi futuri basandosi su naturali processi di calcolo della probabilità, allo stesso modo la statistica utilizzando informazioni note esegue stime probabilistiche sull’esito di eventi futuri mediante applicazione dei concetti derivati da quella branca della matematica conosciuta come calcolo delle probabilità.
Lo scopo di questa lezione introduttiva è di presentare i primi fondamenti concetti di calcolo della probabilità così da fornirti alcune definizioni per procedere in sicurezza nella comprensione ed applicazione dei principi chiave di statistica inferenziale. Si tratta di un passaggio fondamentale nell’apprendimento della statistica in quanto esso consente di eseguire valutazioni statistiche tenendo sotto controllo l’incertezza.
Definizione di probabilità
La probabilità è un concetto naturale noto a tutti senza alcuna necessità di particolare competenza matematica. L’idea di probabilità è infatti un’idea innata in ciascuno: siamo in grado di fornire le nostre stime di probabilità su diversi argomenti, dalle previsioni del meteo fino al vincitore della prossima campagna elettorale. Sebbene la stima possa rivelarsi non accurata, il nostro modo di pensare considera la probabilità come un elemento importante per prendere decisioni sul futuro. Ciò che è particolarmente interessante del nostro rapporto con la probabilità è che quando ci troviamo di fronte ad eventi semplici, sappiamo stimare il loro esito in modo abbastanza accurato.
Esempio tipico è il lancio di una moneta: ancora prima di eseguire il lancio, siamo in grado di affermare che vi sono 50% di possibilità che l’esito sia Testa ed un’uguale percentuale di possibilità che l’esito sia Croce. Cosa ci rende così sicuri dell’esito? Se provassimo a lanciare una moneta un certo numero di volte (e.g., 10 volte), ci potremmo rendere conto che la nostra stima del 50% potrebbe essere non accurata: non è assolutamente certo che lanciando una moneta 10 volte si verifichi 5 volte Testa e 5 volte Croce. Potremmo ad esempio osservare che Testa si verifica 6 volte su 10 e Croce solo 4 volte oppure potrebbe andare anche peggio: potrebbe verificarsi Croce per 8 lanci su 10 e Testa per 2 lanci su 10. In entrambi i casi il risultato concreto dell’esperimento non conferma la nostra probabilità del 50%. Tuttavia, noi rimarremmo comunque convinti che la probabilità che l’esito di una delle due alternative è del 50%. È errata la nostra convinzione o c’è nel nostro ragionamento del fondamento matematico di cui non siamo consapevoli?
La risposta a tale domanda si trova nella teoria del calcolo della probabilità. Quando eseguiamo un esperimento come quello del lancio della moneta, la determinazione della probabilità può essere calcolata seguendo tre approcci: classico, frequentistico e assiomatico.
Approccio classico
Quando calcoliamo la stima della probabilità a priori, ossia senza lanciare la moneta come abbiamo appena fatto, ed affermiamo che la probabilità che l’esito sia Testa è del 50%, stiamo applicando l’approccio classico. Secondo questo approccio la probabilità di un evento è data dal rapporto tra il numero dei casi favorevoli ed il numero dei casi possibili, ossia in notazione matematica:
[math] P\left(A\right)=\frac{m}{N}\ \ \ \ \ (\mathrm{Formula\ 1.1}) [/math]
in cui A è l’evento di cui si sta calcolando la probabilità, m è il numero di volte in cui l’evento si può verificare ed N è il numero di casi possibili. Adattando questa formula al caso del lancio della moneta abbiamo che:
- l’evento A è l’esito di cui si voglia conoscere la probabilità (Testa o Croce);
- il numero dei casi favorevoli è dato dal numero di alternative possibili per ciascun lancio (Testa o Croce), quindi il numero dei casi favorevoli è 1;
- il numero dei casi possibili è il numero degli esiti possibili durante il lancio, quindi 2.
Ne deriva che nel caso si calcoli la probabilità che esca Testa, l’approccio classico sostiene che:
[math]P(\text{Testa})=\frac{1}{2}=0.5\simeq 50\text{%}[/math]
Analogamente, la probabilità che esca Croce è:
[math]P(\text{Croce})=\frac{1}{2}=0.5\simeq 50\text{%}[/math]
Domanda per te: Applica la formula appena vista al caso del lancio del dado a sei facce. Qual è la probabilità che l’esito del lancio sia la faccia con il numero 2?
Applicando l’approccio classico al lancio di un dato a 6 facce, ne risulta che la probabilità che l’esito sia la faccia con il numero 2 è pari a:
[math] P\left(2\right)=\frac{1}{6}=0.2\rightarrow20\text{%} [/math]
Approccio frequentistico
L’approccio frequentistico definisce la probabilità di un evento come il numero di volte (frequenza relativa) in cui l’evento si verifica nel contesto sperimentale. Ciò significa che la probabilità è data dal rapporto tra il numero di casi favorevoli realmente occorsi ed il numero totale di casi osservati o di ripetizioni dell’esperimento, ossia:
[math] P\left(A\right)=\frac{m}{n}\ \ \ \ \ (\mathrm{Formula\ 1.2}) [/math]
in cui m è il numero di eventi occorsi ed n il numero di casi osservati.
Si tratta di una probabilità definita a posteriori, ossia solo dopo aver effettuato l’esperimento (nel caso in esame solo dopo aver lanciato la moneta per un certo numero di volte). Applicando questo approccio nel lancio della moneta la probabilità è data dal rapporto tra il numero di volte in cui si è verificato l’evento Testa diviso per il numero di lanci eseguiti. Come già visto sopra, ne deriva che la probabilità varia a seconda delle uscite di Testa e Croce in un certo numero di lanci.
Teoria della probabilità: legge dei grandi numeri
Comparando le formule 1.1 e 1.2, risulta che esse sono pressoché identiche salvo il denominatore: nella formula della probabilità classica, il denominatore N (maiuscolo) si riferisce ai casi possibili di un fenomeno, mentre nella formula della probabilità frequentistica, il denominatore n (minuscolo) si riferisce al numero di casi realmente osservati o al numero di volte in cui l’esperimento è stato ripetuto. Concettualmente le due formule sono uguali: entrambe osservano i casi occorsi e li mettono in rapporto con il numero di casi possibili. Eppure come visto nel semplice caso del lancio di una moneta, il risultato può portare a risultati completamente diversi. Se applichiamo la probabilità classica, abbiamo che la probabilità di Testa o Croce è rispettivamente del 50%, se invece effettuiamo un certo numero di lanci la probabilità di ciascun esito può oscillare in modo importante.
Qual è dunque il risultato corretto? Quello dato dalla probabilità classica o quello fornito da quella frequentistica?
Per rispondere a questo dilemma, ci serviamo della teoria della probabilità. Questa teoria unisce la definizione di probabilità frequentistica appena esposta con una delle più note leggi statistiche: la legge dei grandi numeri. Secondo questo approccio combinato, la probabilità che si verifichi un certo evento A è pari al rapporto tra il numero di casi favorevoli realmente occorsi ed un numero sufficientemente grande di casi osservati o di ripetizioni dell’esperimento. Ciò significa che la probabilità frequentistica diviene tanto più accurata quanto più il denominatore n è un numero sufficientemente grande da rappresentare la situazione effettiva.
In termini meno matematici, la legge dei grandi numeri ci dice che la probabilità frequentistica diventa tanto più accurata tanto più l’esperimento (e.g., il lancio della moneta) è ripetuto. Ma quanto deve essere grande n? Sufficientemente grande è una quantità soggettiva e assolutamente non definibile.
Come di consueto in matematica, quando una quantità aumenta in modo considerevole, si procede assumendo che essa possa raggiungere l’infinito. Dunque, assumendo che il denominatore n della Formula 1.2 tende ad infinito, la legge dei grandi numeri ci consente di affermare che:
[math] P\left(A\right)=\lim_{n \to \infty } {\frac{m}{n}}=\frac{m}{N} [/math]
formula che afferma che “La probabilità dell’evento A è uguale al limite per n che tende ad infinito del rapporto tra m ed n”. In termini pratici la formula ci dice che al crescere di n (ossia di osservazioni o di ripetizioni di uno stesso esperimento) la probabilità frequentistica è uguale alla probabilità classica.
Questo passaggio matematico attraverso l’applicazione della legge dei grandi numeri e l’utilizzo del limite giustifica il nostro asserto secondo cui lanciando una moneta la probabilità che l’esito sia Testa è pari al 50%. Se lanciassimo la moneta un numero infinito di volte, il risultato sarebbe proprio 50%!
MATH TIME: Il limite
Il limite è un concetto matematico che rientra nell’ambito dello studio dell’analisi matematica. Esso consente di ipotizzare e prevedere cosa succede in scenari al “limite” del possibile, ossia in tutte quelle situazioni ai confini dello spazio matematico, ossia l’infinitamente grande (infinito) o l’infinitamente piccolo (infinitesimo). Nell’ambito della teoria della probabilità abbiamo visto un’applicazione del concetto di limite quando i numeri diventano talmente grande da “tendere ad infinito”. Esso ci consente di capire cosa succede alla probabilità se ripetessimo l’esperimento un numero infinito di volte.
Un altro caso di applicazione del limite si ha quando i numeri diventano molto piccoli tanto da avvicinarsi ad un valore limite senza tuttavia mai raggiungerlo. Un esempio da manuale è quello che riguarda la divisione di un qualsiasi numero per zero. Sin dalla scuola elementare sappiamo che è impossibile eseguire la divisione per zero. Dunque, l’operazione 5:0 è impossibile. Tuttavia, è possibile eseguire le seguenti divisioni:
Osservando le divisioni appena esposte si osserva che:
- è possibile eseguire divisioni per valori sempre più prossimi a zero;
- la divisione è impossibile solo quando il valore è 0;
- più il denominatore si avvicina a zero, più il risultato diverge (ossia si sposta verso numeri molto grandi o molto piccoli a seconda del segno).
È dunque spontaneo chiedersi: “Ok, cosa succede alla divisione quando il valore è proprio vicinissimo a zero (tende a zero) senza tuttavia mai toccare zero?”. Qui entra in gioco il concetto di limite. Applicando il limite e considerando la tendenza vista nelle divisioni sopra eseguite si ha che:
ossia il rapporto tra 5 ed un qualunque valore x prossimo allo zero è pari ad infinito (valore senza il segno). Questo significa che se il valore di x è un numero vicinissimo a zero e negativo (e.g., -0.002, -0.000001, …), il valore del limite tende a meno infinito, ossia un numero negativo con un valore enorme (e.g., -5,000,000,000,000). Se invece il valore di x è un numero vicinissimo a zero e positivo (e.g., 0.002, 0.000000003, …), il valore del limite tende a più infinito, ossia ad un numero positivo con un valore enorme (e.g., 5,000,000,000,000).