In der Statistik ist die Normalverteilung (oder Normalverteilung) eine der wichtigsten und am häufigsten verwendeten Wahrscheinlichkeitsverteilungen. Sie ist auch unter der Bezeichnung Naturgesetz oder Gaußsche Verteilung bekannt, zu Ehren des Mathematikers Carl Friedrich Gauss der sich eingehend mit seinen Eigenschaften befasst hat.
Die Normalverteilung ist durch ihre symmetrische Glockenform gekennzeichnet, was bedeutet, dass sich die meisten Werte um den Mittelwert gruppieren und die Werte sich vom Mittelwert entfernen, wenn sie größer oder kleiner werden. Die Normalverteilung wird durch zwei Parameter definiert:
- Mittelwert (µ): Dies ist die Mitte der Glocke und stellt den Wert dar, um den sich die anderen Werte gruppieren.
- Standardabweichung (σ) : Dies ist ein Maß für die Streuung der Werte im Verhältnis zum Mittelwert. Je größer die Standardabweichung, desto größer ist die Streuung der Werte.
Die Wahrscheinlichkeitsdichtefunktion der Normalverteilung ist durch die folgende mathematische Formel für eine Zufallsvariable gegeben:
f(x)=\frac{1}{\sigma\sqrt{2\pi}}e^{-\frac{(x-\mu)^{2}}{2\sigma^{2}}}
Diese Verteilung hat mehrere wichtige Eigenschaften:
- Symmetrie: Die Verteilung ist symmetrisch in Bezug auf ihren Mittelwert.
- Glockenform: Die meisten Werte liegen in der Nähe des Mittelwerts, und die Wahrscheinlichkeit von Extremwerten nimmt mit zunehmender Entfernung vom Mittelwert rasch ab.
- 68-95-99.7 Regel: Etwa 68% der Werte liegen innerhalb einer Standardabweichung vom Mittelwert, 95% innerhalb von zwei Standardabweichungen und 99.7% innerhalb von drei Standardabweichungen.
- Die Normalverteilung wird aufgrund ihrer bekannten mathematischen Eigenschaften und ihres häufigen Auftretens bei vielen natürlichen und experimentellen Phänomenen in vielen Bereichen der Statistik verwendet, u. a. bei der statistischen Inferenz, der Modellierung und dem Testen von Hypothesen.
Reduzierte zentrierte Normalverteilung
Die "zentrierte reduzierte Normalverteilung" bezieht sich auf eine standardisierte Normalverteilung, d. h. eine Normalverteilung mit einem Mittelwert von 0 und einer Standardabweichung von 1. Dies ist eine der am häufigsten verwendeten Verteilungen in der Statistik.
Tatsächlich kann jede normale Variable in eine reduzierte zentrierte Normale umgewandelt werden, indem der Mittelwert der Variable subtrahiert und durch die Standardabweichung dividiert wird. Diese Normalisierung ist nützlich, da sie den Vergleich von Variablen ermöglicht, die ursprünglich unterschiedliche Einheiten oder Skalen haben können. Außerdem vereinfacht sie die Berechnungen in vielen statistischen Zusammenhängen.
Für eine Zufallsvariable X, die einer Normalverteilung mit einem Mittelwert μ und einer Standardabweichung σ folgt. Die Normalisierung von X auf die reduzierte zentrierte Normalverteilung (oft als Z bezeichnet) erfolgt mithilfe der Formel :
Z=\frac{X-\mu}{\sigma}
Der Z-Wert stellt die Abweichung in Anzahl der Standardabweichungen vom Mittelwert dar. Er kann positiv oder negativ sein.
- Ein Wert von Z=2, bedeutet, dass dieser Punkt über dem Mittelwert µ liegt und die Abweichung von diesem 2 Standardabweichungen σ beträgt.
- Ein Wert von Z=-3.5, bedeutet, dass dieser Punkt unter dem Mittelwert µ liegt und die Abweichung von diesem 3.5 Standardabweichungen σ beträgt.
Mit dieser Transformation werden wir in der Lage sein, die Tabelle der reduzierten zentrierten Normalverteilung zu verwenden. Mit dieser Tabelle können Sie die Werte der Verteilungsfunktion der Normalverteilung F(x) in Abhängigkeit vom Wert von Z bestimmen.
F(Z)=\int_{-\infty }^{Z}\frac{1}{\sqrt{2\Pi}}e^{-\frac{u^{2}}{2}}
Mit :
- F(Z): Die Verteilungsfunktion der Standardnormalverteilung (oder reduzierten zentrierten Normalverteilung). Sie ist eine mathematische Funktion, die die Wahrscheinlichkeit angibt, dass eine Zufallsvariable, die einer Standardnormalverteilung folgt, kleiner oder gleich einem bestimmten Wert ist.
𝐹(𝑍)=𝑃(𝑧 ≤ 𝑍)
Der Wert von F(Z) liegt immer zwischen 0 und 1, da es sich um eine Wahrscheinlichkeit handelt.
Die Werte der Verteilungsfunktion F(Z) für die Standardnormalverteilung werden in vielen Bereichen der Statistik verwendet, um Wahrscheinlichkeitsberechnungen durchzuführen, z. B. bei Hypothesentests, Konfidenzintervallen, der Schätzung der Nichtübereinstimmungsrate, der Schätzung der Prozesszuverlässigkeit und anderen statistischen Analysen.
Die Verteilungsfunktion F(Z) kann nicht in Form von Elementarfunktionen (wie Polynomen, Exponentialfunktionen oder trigonometrischen Funktionen) ausgedrückt werden und erfordert oft die Verwendung von statistischen Tabellen oder Computersoftware zur Berechnung der Wahrscheinlichkeitswerte, die mit bestimmten Werten von Z verbunden sind. Im Fall der Normalverteilung wird die Tabelle der reduzierten zentrierten Normalverteilung, auch Z -Tabelle genannt, zur Berechnung von F(Z) verwendet :
Beispiel:
Ermitteln Sie die Werte für die folgenden Wahrscheinlichkeiten unter Verwendung der Normalverteilung :
𝑃(𝑧≤0), 𝑃(𝑧≤-2), 𝑃(𝑧≥1.55), 𝑃(-2≤ 𝑧 ≤1.55)
Lösung :
Wahrscheinlichkeit |
𝑃(𝑧≤0) = 0.5Pz ≤ 0 = 0.5 |
𝑃(𝑧≤-2)=𝑃(2≤𝑧)=1-𝑃(𝑧≤2) = 1-0.9772=0.0228 |
𝑃(𝑧≥1.55) = 1-𝑃(𝑧≤1.55)= 1-0.9394 = 0,0606 |
𝑃(-2≤𝑧≤1.55) = 𝑃(𝑧≤1.55)-𝑃(𝑧≤-2) = 0.9394-0.0228 = 0.9166 |
Berechnung des Prozentsatzes außerhalb der Toleranz
Wie bei der Festlegung der Eigenschaften der Normalverteilung angesprochen, ist die Normalverteilung vollständig charakterisiert, sobald ihr Mittelwert und ihre Standardabweichung bekannt sind. Im Einzelnen :
- Rund 68,27% der Beobachtungen lagen innerhalb einer Standardabweichung vom Mittelwert.
- Etwa 95,45% der Beobachtungen lagen innerhalb von zwei Standardabweichungen des Mittelwerts.
- Etwa 99,73% der Beobachtungen lagen innerhalb von drei Standardabweichungen des Mittelwerts.
Diese Prozentsätze beschreiben, wie die Daten in einer Normalverteilung um den Mittelwert herum verteilt sind, und liefern wertvolle Hinweise auf die Streuung der Werte im Vergleich zum Mittelwert.
Um jedoch den Prozentsatz der Elemente außerhalb der tolerierten Grenzen in einer Population genauer zu bewerten, kann man die Berechnung der z-Zahl verwenden.
Die Zahl z wird folgendermaßen berechnet:
Z = "frac" (frustriert) ************
Er stellt die Messung in Form von Standardabweichungen zwischen dem Mittelwert der Stichprobe und der Toleranzgrenze dar.
Sobald die Zahl z bestimmt ist, kann man den Prozentsatz der Elemente außerhalb der Toleranz mithilfe der Gauß-Tabelle oder der Tabelle der reduzierten zentrierten Normalverteilung berechnen. Mithilfe dieser Tabelle lässt sich der Anteil der Werte jenseits eines bestimmten Abstands (dargestellt durch die Zahl z) vom Mittelwert in einer Normalverteilung finden, was bei der Einschätzung des Prozentsatzes der Elemente außerhalb der tolerierten Grenzen hilft.
Beispiel:
Finde den Gesamtprozentsatz außerhalb der Toleranz, wobei der mittlere Durchmesser µ=10.1mm und die Standardabweichung σ=0.5mm ist und das Toleranzintervall IT=[9; 11] beträgt.
Berechnen wir den zmin:
Z_min = \rap \rap \rap \rap \rap \rap \rap \rap \rap \rap \rap \rap \rap = 2.2
Daraus wird der Prozentsatz der Teile außerhalb der min-Toleranz in der Gauß-Tabelle abgeleitet:
% HT min = 100% - 98.61% = 1.39%
Berechnen wir den zmax:
Z_max = \c&Fresh{mu-text}{toleranz} = \c&Fresh{10.1-11}{0.5} = 1.8
Daraus wird der Prozentsatz der Teile außerhalb der Toleranz max in der Gauß-Tabelle abgeleitet :
% HT max =100%-98,61% = 3.59%
Man zieht also den gesamten Prozentsatz außerhalb der Toleranz ab :
% HT= % HTmin +% HTmax
% HT = 1.39%+3.59%≈5%