Le théorème central limite nous indique :
Tout système, résultant de la somme de nombreux facteurs indépendants les uns des autres et d’un ordre de grandeur équivalent, génère une loi de répartition qui tend vers une loi normale.
Mais on peut également raisonner de la manière inverse. Si l’on observe une loi qui n’est pas normale alors l’une des hypothèses du théorème n’est pas valide :
- Cas 1 : le système n’est pas résultant de la somme de nombreux facteurs : Il est peut-être le produit de nombreux facteurs ou autre. Dans ce cas, la loi de distribution peut être différente et en générale une transformation (en prenant par exemple le log du résultat) permettra de retrouver une loi normale.
- Cas 2 : Les facteurs ne sont pas indépendants les uns des autres
- Cas 3 : Les facteurs ne sont pas d’un ordre de grandeur équivalent :
Un facteur est prépondérant devant les autres. Dans ce cas, il convient de trouver le facteur en question car lui seul génère une source importante de variabilité.
Une valeur aberrante pollue la distribution. Dans ce cas, il convient de trouver la cause de la valeur aberrante et de l’éliminer si la cause a pu être expliquée.
Dans ces deux cas de figure, il ne faut pas trouver une loi de distribution correspondant à la variabilité observée. En effet, cette loi de distribution ne sera pas répétable dans le temps car due à un seul paramètre, elle n’aura donc aucune propriété prédictive.
Si l’origine de la non normalité est due au cas 1, il convient dès lors de trouver la loi de distribution correspondante, en particulier si l’on souhaite prédire le pourcentage de valeurs en dehors de la tolérance. Pour cela vous pouvez utiliser un logiciel comme le module Data Analysis d’Ellistat et vérifier les propositions de lois de distribution situées en bas de la fenêtre pour voir si l’une des distributions permet de rendre compte des données observées.