Der zentrale Grenzwertsatz sagt uns :
Jedes System, das sich aus der Summe vieler voneinander unabhängiger Faktoren gleicher Größenordnung ergibt, erzeugt eine Verteilungsregel, die zu einer Normalverteilung tendiert.
Man kann aber auch umgekehrt argumentieren. Wenn wir eine Gesetzmäßigkeit beobachten, die nicht normal ist, dann ist eine der Annahmen des Theorems ungültig:
- Fall 1: Das System ist nicht das Ergebnis der Summe vieler Faktoren: Es ist vielleicht das Produkt vieler Faktoren oder etwas anderes. In diesem Fall kann das Verteilungsgesetz unterschiedlich sein und in der Regel wird durch eine Transformation (z. B. indem man den Log des Ergebnisses nimmt) wieder eine Normalverteilung erreicht.
- Fall 2: Die Faktoren sind nicht unabhängig voneinander
- Fall 3: Die Faktoren sind nicht von gleicher Größenordnung :
Ein Faktor ist vor allen anderen Faktoren vorherrschend. In diesem Fall gilt es, diesen Faktor zu finden, da er allein eine bedeutende Quelle der Variabilität erzeugt.
Ein Ausreißer verschmutzt die Verteilung. In diesem Fall sollte die Ursache für den Ausreißer gefunden und der Wert beseitigt werden, wenn die Ursache erklärt werden konnte.
In beiden Fällen ist es nicht sinnvoll, ein Verteilungsgesetz zu finden, das der beobachteten Variabilität entspricht. Denn dieses Verteilungsgesetz wird im Laufe der Zeit nicht wiederholbar sein, da es auf einen einzigen Parameter zurückzuführen ist, es hat also keine prädiktive Eigenschaft.
Wenn der Ursprung der Nichtnormalität auf Fall 1 zurückzuführen ist, muss von nun an das entsprechende Verteilungsgesetz gefunden werden, insbesondere wenn man den Prozentsatz der Werte außerhalb der Toleranz vorhersagen möchte. Hierfür können Sie eine Software wie das Modul Data Analysis von Ellistat und überprüfen Sie die Vorschläge für Verteilungsgesetze, die sich unten im Fenster befinden, um zu sehen, ob eine der Verteilungen die beobachteten Daten wiedergeben kann.