Der zentrale Grenzwertsatz sagt uns :
Jedes System, das sich aus der Summe vieler voneinander unabhängiger Faktoren gleicher Größenordnung ergibt, erzeugt eine Verteilungsregel, die zu einer Normalverteilung tendiert.
Man kann aber auch umgekehrt argumentieren. Wenn wir eine Gesetzmäßigkeit beobachten, die nicht normal ist, dann ist eine der Annahmen des Theorems ungültig:
- Fall 1: Das System ist nicht das Ergebnis der Summe vieler Faktoren: Es ist vielleicht das Produkt vieler Faktoren oder etwas anderes. In diesem Fall kann das Verteilungsgesetz unterschiedlich sein und in der Regel wird durch eine Transformation (z. B. indem man den Log des Ergebnisses nimmt) wieder eine Normalverteilung erreicht.
- Fall 2: Die Faktoren sind nicht unabhängig voneinander
- Fall 3: Die Faktoren sind nicht von gleicher Größenordnung :
Ein Faktor ist vor allen anderen Faktoren vorherrschend. In diesem Fall gilt es, diesen Faktor zu finden, da er allein eine bedeutende Quelle der Variabilität erzeugt.
Ein Ausreißer verschmutzt die Verteilung. In diesem Fall sollte die Ursache für den Ausreißer gefunden und der Wert beseitigt werden, wenn die Ursache erklärt werden konnte.
In beiden Fällen ist es nicht sinnvoll, ein Verteilungsgesetz zu finden, das der beobachteten Variabilität entspricht. Denn dieses Verteilungsgesetz wird im Laufe der Zeit nicht wiederholbar sein, da es auf einen einzigen Parameter zurückzuführen ist, es hat also keine prädiktive Eigenschaft.
Si l’origine de la non normalité est due au cas 1, il convient dès lors de trouver la loi de distribution correspondante, en particulier si l’on souhaite prédire le pourcentage de valeurs en dehors de la tolérance. Pour cela vous pouvez utiliser un logiciel comme le Modul Data Analysis d’Ellistat et vérifier les propositions de lois de distribution situées en bas de la fenêtre pour voir si l’une des distributions permet de rendre compte des données observées.