In statistica, la legge normale (o distribuzione normale) è una delle distribuzioni di probabilità più importanti e comunemente utilizzate. È conosciuta anche come legge naturale o distribuzione gaussiana, in onore del matematico Carl Friedrich Gauss che ne ha studiato le proprietà in dettaglio.
La distribuzione normale è caratterizzata da una forma a campana simmetrica, il che significa che la maggior parte dei valori si raggruppa intorno alla media e che i valori si allontanano dalla media quando diventano più grandi o più piccoli. La distribuzione normale è definita da due parametri:
- Media (µ): È il centro della campana, che rappresenta il valore attorno al quale si raggruppano gli altri valori.
- Deviazione standard (σ): È una misura della dispersione dei valori rispetto alla media. Maggiore è la deviazione standard, maggiore è la dispersione dei valori.
La funzione di densità di probabilità della distribuzione normale è data dalla seguente formula matematica per una variabile casuale :
f(x)=\frac{1}{\sigma\sqrt{2\pi}}e^{-\frac{(x-\mu)^{2}}{2\sigma^{2}}}
Questa distribuzione ha diverse proprietà importanti:
- Simmetria: la distribuzione è simmetrica rispetto alla media.
- Forma a campana: la maggior parte dei valori è vicina alla media e la probabilità di valori estremi diminuisce rapidamente man mano che ci si allontana dalla media.
- 68-95-99,7 Regola: circa 68% dei valori rientrano in una deviazione standard della media, 95% in due deviazioni standard e 99,7% in tre deviazioni standard.
- La distribuzione normale è utilizzata in molte aree della statistica, tra cui l'inferenza statistica, la modellizzazione e i test di ipotesi, grazie alle sue note proprietà matematiche e alla sua frequenza in molti fenomeni naturali e sperimentali.
Distribuzione normale ridotta
La distribuzione "normale ridotta centrata" si riferisce a una distribuzione normale standard, cioè una distribuzione normale con una media di 0 e una deviazione standard di 1. È una delle distribuzioni più comunemente utilizzate in statistica.
Qualsiasi variabile normale può essere trasformata in una normale centrata ridotta sottraendo la media della variabile e dividendola per la deviazione standard. Questa normalizzazione è utile per confrontare variabili che inizialmente possono avere unità o scale diverse. Inoltre, semplifica i calcoli in molti contesti statistici.
Per una variabile casuale X che segue una distribuzione normale con media μ e deviazione standard σ. La normalizzazione di X per ottenere la normale ridotta centrata (spesso nota come Z) viene effettuata utilizzando la formula :
Z=\frac{X-\mu}{\sigma}
Il valore di Z rappresenta il numero di deviazioni standard dalla media. Può essere positivo o negativo.
- Un valore di Z=2 significa che questo punto si trova al di sopra della media µ e che lo scostamento dalla media è di 2 deviazioni standard σ.
- Un valore di Z=-3,5 significa che questo punto è al di sotto della media µ e che lo scostamento dalla media è di 3,5 deviazioni standard σ.
Con questa trasformazione, possiamo utilizzare la tabella della distribuzione normale ridotta centrata. Questa tabella è utilizzata per determinare i valori della funzione di distribuzione della distribuzione normale F(x) in funzione del valore di Z.
F(Z)=\int_{-\infty }^{Z}\frac{1}{\sqrt{2\Pi}}e^{-\frac{u^{2}}{2}}
Con :
- F(Z) : La funzione di distribuzione della distribuzione normale standard (o distribuzione normale ridotta centrata). È una funzione matematica che fornisce la probabilità che una variabile casuale che segue una distribuzione normale standard sia minore o uguale a un determinato valore.
𝐹(𝑍)=𝑃(𝑧 ≤ 𝑍)
Il valore di F(Z) è sempre compreso tra 0 e 1, perché si tratta di una probabilità.
I valori della funzione di distribuzione F(Z) per la distribuzione normale standard sono utilizzati in molte aree della statistica per eseguire calcoli di probabilità, tra cui test di ipotesi, intervalli di confidenza, stima del tasso di non conformità, stima dell'affidabilità del processo e altre analisi statistiche.
La funzione di distribuzione F(Z) non può essere espressa in termini di funzioni elementari (come polinomi, esponenziali o trigonometrici) e spesso richiede l'uso di tabelle statistiche o di software informatici per calcolare i valori di probabilità associati a specifici valori di Z. Nel caso della distribuzione normale, per calcolare F(Z) si utilizzerà la tabella di distribuzione normale a centro ridotto, nota anche come tabella Z:
Esempio:
Trovare i valori delle seguenti probabilità utilizzando la distribuzione normale:
𝑃(𝑧≤0), 𝑃(𝑧≤-2), 𝑃(𝑧≥1,55), 𝑃(-2≤ 𝑧 ≤1,55)
Soluzione:
Probabilità |
𝑃(𝑧≤0) = 0,5Pz ≤ 0 = 0,5 |
𝑃(𝑧≤-2)=𝑃(2≤𝑧)=1-𝑃(𝑧≤2) = 1-0,9772=0,0228 |
𝑃(𝑧≥1,55) = 1-𝑃(𝑧≤1,55)= 1-0,9394 = 0,0606 |
𝑃(-2≤𝑧≤1,55) = 𝑃(𝑧≤1,55)-𝑃(𝑧≤-2) = 0,9394-0,0228 = 0,9166 |
Calcolo della percentuale di fuori tolleranza
Come discusso quando si stabiliscono le caratteristiche della distribuzione normale, essa è completamente caratterizzata non appena si conoscono la sua media e la sua deviazione standard. Più precisamente:
- Circa 68,27% delle osservazioni rientrano in una deviazione standard della media.
- Circa il 95,45% delle osservazioni rientra in due deviazioni standard della media.
- Circa il 99,73% delle osservazioni rientra in tre deviazioni standard della media.
Queste percentuali descrivono la distribuzione dei dati intorno alla media in una distribuzione normale, fornendo informazioni preziose sulla dispersione dei valori rispetto alla media.
Tuttavia, per valutare con maggiore precisione la percentuale di elementi al di fuori dei limiti tollerati in una popolazione, è possibile calcolare il numero z.
Il numero z viene calcolato come segue:
Z = \frac{\mu-text{tolleranza}}{{sigma}}
Rappresenta la misura in termini di deviazioni standard tra il valore medio del campione e il limite di tolleranza.
Una volta determinato il numero z, è possibile calcolare la percentuale di elementi fuori tolleranza facendo riferimento alla tabella di Gauss o alla tabella di distribuzione normale ridotta centrata. Questa tabella serve a trovare la percentuale di valori che si trovano oltre una certa distanza (rappresentata dal numero z) dalla media in una distribuzione normale, il che aiuta a valutare la percentuale di elementi al di fuori dei limiti tollerati.
Esempio:
Trovare la percentuale totale di fuori tolleranza, dato che il diametro medio è µ=10,1 mm e la deviazione standard σ=0,5 mm e l'intervallo di tolleranza IT=[9; 11].
Calcoliamo il valore zmin:
Z_{min} = \frac{\mu-\text{tolleranza}}{\sigma} = \frac{10,1-9}{0,5} = 2,2
Questo fornisce la percentuale di pezzi al di fuori della tolleranza minima nella tabella gaussiana:
% HT min = 100% - 98,61% = 1,39%
Calcoliamo il valore zmassimo:
Z_{max} = \frac{mu-testo{tolleranza}}{sigma} = \frac{10,1-11}{0,5} = 1,8
Da questo si può dedurre la percentuale di pezzi fuori tolleranza massima nella tabella Gauss:
% HT max =100%-98,61% = 3,59%
La percentuale totale di fuori tolleranza viene quindi dedotta :
% HT= % HTmin +% HTmax
% HT = 1,39%+3,59%≈5%