Legge non normale

Tempo di lettura

Il teorema del limite centrale ci dice che : 

Qualsiasi sistema, risultante dalla somma di molti fattori indipendenti tra loro e di ordine di grandezza equivalente, genera una legge di distribuzione che tende a una distribuzione normale. 

Ma possiamo anche ragionare in modo opposto. Se osserviamo una distribuzione che non è normale, allora una delle ipotesi del teorema non è valida: 

  • Caso 1: il sistema non è la somma di molti fattori: può essere il prodotto di molti fattori o altro. In questo caso, la legge di distribuzione può essere diversa e, in generale, una trasformazione (prendendo il log del risultato, ad esempio) ripristinerà una distribuzione normale. 
  • Caso 2: I fattori non sono indipendenti l'uno dall'altro 
  • Caso 3: I fattori non sono dello stesso ordine di grandezza: 

Un fattore prevale sugli altri. In questo caso, dobbiamo trovare il fattore in questione, perché da solo genera una fonte importante di variabilità. 

Un outlier sta inquinando la distribuzione. In questo caso, è necessario trovare la causa dell'outlier ed eliminarlo se la causa può essere spiegata. 

In questi due casi, non è necessario trovare una legge di distribuzione corrispondente alla variabilità osservata. Infatti, questa legge di distribuzione non sarà ripetibile nel tempo perché è dovuta a un singolo parametro, quindi non avrà proprietà predittive. 

Se l'origine della non normalità è dovuta al caso 1, è necessario trovare la legge di distribuzione corrispondente, soprattutto se si vuole prevedere la percentuale di valori fuori tolleranza. Per farlo, si può utilizzare un software come Modulo di analisi dei dati di Ellistat e controllare le distribuzioni proposte nella parte inferiore della finestra per vedere se una delle distribuzioni rende bene conto dei dati osservati.