Ein Konfidenzintervall ist ein plausibler Bereich von Werten für einen statistischen Parameter, der anhand einer Datenprobe geschätzt wird. Es vermittelt eine Vorstellung davon, wie genau unsere Schätzung des Parameters ist. Das Konfidenzintervall wird in der Regel mit einem zugehörigen Konfidenzniveau ausgedrückt, das die Wahrscheinlichkeit darstellt, dass das Intervall tatsächlich den wahren Parameter der Grundgesamtheit enthält.
Durchschnitt :
Das Konfidenzintervall des Mittelwerts ist ein statistisches Intervall, das eine plausible Schätzung des Intervalls liefert, in dem sich der wahre Mittelwert einer Population befindet. Es wird aus den Daten einer Stichprobe dieser Population konstruiert.
Sicherlich ist die Bildung eines Konfidenzintervalls für den Mittelwert durch den zentralen Grenzwertsatz möglich. Bei ausreichend großen Stichproben (n≥30), unabhängig von der Verteilungsform der Grundgesamtheit, wenn mehrere Stichproben der Größe "n" zufällig gezogen werden, werden die Mittelwerte dieser Stichproben \/left\/overline{X} \c&H30D3F4&} annähernd normalverteilt sind. Dadurch können zuverlässige Konfidenzintervalle konstruiert werden, um den wahren Durchschnitt der Bevölkerung zu schätzen.
Die Konstruktion des Konfidenzintervalls des Mittelwerts beruht auf der Verwendung der Student-t-Verteilung oder der Normalverteilung, je nachdem, wie groß die Stichprobe ist und wie viel wir über die Standardabweichung der Grundgesamtheit wissen.
Da es sich bei dieser Berechnung um eine Näherung handelt, ist es wichtig, die Genauigkeit dieser Näherung zu kennen. Um die Genauigkeit dieser Näherung zu bestimmen, berechnet man in der Regel das Intervall bei 95%. Dieses Intervall entspricht :
Intervall bei 95% = Intervall, in dem es eine Chance von 95% gibt, dass der wahre Mittelwert der Verteilung darin liegt.
In der Statistik heißt 95% Konfidenz (1- α), sie ist komplementär zum Risiko erster Art α=5%. Dieses Risiko stellt, die Chance dar, dass der Mittelwert der Verteilung außerhalb des Konfidenzintervalls liegt.
So konstruiert man ein Konfidenzintervall für den Mittelwert :
- Berechnung des Mittelwerts und der Standardabweichung der Stichprobe der Größe "n": Berechnen Sie anhand der Stichprobendaten den Mittelwert und die Standardabweichung der Stichprobe \c&H30D3F4&} und S.
- Auswahl des Konfidenzniveaus (1- α) : Wählen Sie ein Konfidenzniveau, das oft in Prozent angegeben wird, z. B. 95% oder 99%. Ein Konfidenzniveau von 95% bedeutet, dass wir zu 95% darauf vertrauen, dass das Intervall, das wir konstruieren, den wahren Mittelwert der Population enthalten wird.
- Bestimmung des Intervalls: Verwenden Sie die Formel für das Konfidenzintervall für den Mittelwert auf der Grundlage der entsprechenden Verteilung ( Student oder Normalverteilung) :
- Wenn Sie die Standardabweichung der Bevölkerung 𝜎 kennen, verwenden Sie die Normalverteilung :
- IC = \c&H30D3F4&} \underline{+}Z_{\frac{a}{2}}\ast \frac{S}{\sqrt{n}} wo:
- Zfrac{2}{a} : ist die z-Punktzahl, die dem Vertrauensniveau entspricht. (Zweiseitig)
- n: ist die Größe der Stichprobe.
- IC = \c&H30D3F4&} \underline{+}Z_{\frac{a}{2}}\ast \frac{S}{\sqrt{n}} wo:
- Wenn Sie die Standardabweichung der Population 𝜎 nicht kennen, verwenden Sie die Student-Verteilung :
- IC = \c&H30D3F4&} \underline{+}t_{\frac{a}{2}n-1}\ast \frac{S}{\sqrt{n}} wo:
- t_{{frac{a}}}: ist die t-Punktzahl, die dem Konfidenzniveau entspricht und für n-1 Freiheitsgrade.
- n: ist die Größe der Stichprobe.
- IC = \c&H30D3F4&} \underline{+}t_{\frac{a}{2}n-1}\ast \frac{S}{\sqrt{n}} wo:
- Wenn Sie die Standardabweichung der Bevölkerung 𝜎 kennen, verwenden Sie die Normalverteilung :
Das Konfidenzintervall des Mittelwerts gibt also einen Bereich von Werten an, innerhalb dessen wir zu einem bestimmten Vertrauensniveau (1-𝛼) darauf vertrauen, dass sich der wahre Mittelwert der Population µ befindet. Je höher das Konfidenzniveau, desto breiter ist der Bereich, was ein höheres Maß an Vertrauen in die Schätzung widerspiegelt.
Standardabweichung S | Stichprobengröße n | Vertrauen (1-α) | |
Breite des Konfidenzintervalls des Mittelwerts KI. | Breite IC steigt, wenn die Standardabweichung steigt | Breite IC nimmt ab, wenn die Stichprobengröße steigt | Breite der KI nimmt zu, wenn das Vertrauen steigt |
Beispiel: Man möchte wissen, wie man das Konfidenzintervall für den durchschnittlichen Zuckerverbrauch pro Familie bei 95% Konfidenzniveau berechnet. Es wurde eine Stichprobe von 18 Familien gezogen. Nachfolgend die Tabelle mit den Ergebnissen :
5 | 13 | 11 | 5 | 2 | 3 | 2 | 1 | 6 | 14 | 6 | 8 | 2 | 13 | 9 | 5 | 12 | 7 |
Lösung :
Berechnen wir den Mittelwert, die Standardabweichung und die Anzahl der Freiheitsgrade
\X = \c&H304D3+2+2+1+6+14+6+8+2+13+9+5+12+7}{18} = 6.88
S = sqrt{frac{sum_1}^{N}(xi-overline{x})^{2}{17}} = 4.25
n-1 =17
Von der Student's Law Table aus oder mit der Software Ellistat Data Analysisfindet man den Wert t=2.110
Daraus lässt sich das folgende Konfidenzintervall ableiten:
\c&Heart \c&Heart \c&Heart \c&Heart \c&Heart \c&Heart \c&Heart \c&Heart \c&Heart \c&Heart \c&Heart \c&Heart \c&Heart \c&Heart \c&Heart \c&Heart \c&Heart \c&Heart \c&Heart \c&Heart \c&Heart \c&Heart \c&Heart \c&Heart \c&Heart \c&Heart
6.88-2.110 \c&Heat 4.25 \c&Heat 4.25 \c&Heat 4.25 \c&Heat 18}}
4.773 \c&H30D3F4&Or 9.005
Varianz / Standardabweichung:
Um ein Konfidenzintervall für die Varianz einer Population zu konstruieren, verwendet man die Chi-2-Verteilung (x^{2}). Die Varianz wird nämlich bekanntlich mit Hilfe der folgenden Formel geschätzt:
</p><p>Die Chi-2-Formel ([latex]x^{2} der Varianz wird wie folgt geschrieben:
X ^2} = ^frac{(n-1)S^2}{sigma^2}}
Die Kurve der Dichtefunktion ein von chi-2 (x^{2}) ähnelt einer Normalverteilung, ist aber nicht symmetrisch. Und vor allem hängt ihre Form von der Anzahl der Freiheitsgrade ab. Die folgende Grafik zeigt das Muster der Dichtefunktion von chi-2 (x^{2})für einen Freiheitsgrad von n=4 .
Die Formel von x^{2} kann ausgewertet werden, um das Konfidenzintervall der Varianz 𝜎² abzuleiten, für eine Stichprobengröße n und ein 1-α-Konfidenzniveau.
\frac{(n-1)S^{2}}{X^{2}_{n-1;\frac{a}{2}}}\le \sigma^{2}\le \frac{(n-1)S^{2}}{X^{2}n-1;1-\frac{a}{2}}
Prozess zur Berechnung des Konfidenzintervalls der Varianz :
- Berechnen Sie die Varianz und die Freiheitsgrade: Berechnen Sie anhand der Stichprobendaten die Varianz S², und die Freiheitsgrade (n-1).
- Finden Sie die kritischen Werte des Chi-Quadrats: Suchen Sie nach den kritischen Werten des Chi-Quadrats X^{2}n-1;\frac{a}{2}\text{et}X^{2}n-1;1-\frac{a}{2} für das gewünschte Konfidenzniveau und die Freiheitsgrade. Sie können diese Werte in 𝜒2-Verteilungstabellen oder mithilfe von Ellistat finden.
- Verwenden Sie die folgenden Formeln, um das Konfidenzintervall der Varianz zu bestimmen :
\frac{(n-1)S^{2}}{X^{2}_{n-1;\frac{a}{2}}}\le \sigma^{2}\le \frac{(n-1)S^{2}}{X^{2}n-1;1-\frac{a}{2}}
NB: Das Konfidenzintervall der Standardabweichung kann auf diese Weise abgeleitet werden, indem man die Wurzel auf jede Seite setzt.
\sqrt{\frac{(n-1)S^{2}}{X^{2}n-1;\frac{a}{2}}}\le \sigma\le \sqrt{\frac{(n-1)S^{2}}{X^{2}n-1;1-\frac{a}{2}}}
Beispiel: Aus der Produktion wurde eine Stichprobe von 10 Zylindern entnommen. Man möchte eine Vorstellung von der Variabilität des Prozesses bekommen. Bestimmen Sie das Konfidenzintervall der Varianz 𝜎2 bei einem Konfidenzniveau von 95% :
10 | 10 | 12 | 10 | 11 |
10 | 11 | 11 | 10 | 11 |
Lösung :
Berechnen wir die Standardabweichung S und die Anzahl der Freiheitsgrade :
S ^{2} = \frac \um_{1}^{N}(xi-\overline{x})^{2}}{9} = 0.489
n-1=9
Für ein (1-α)-Konfidenzniveau von 95% lassen sich die Werte der Quantile ableiten, die bei der Berechnung des Konfidenzintervalls der Varianz verwendet werden:
\c&H30D3F4&}} = 0.025text{ und } 1-\c&H30D3F4&}} = 0.975
Aus der Tabelle des Gesetzes von 𝜒2, oder mit der Ellistat-Software findet man den Wert von X^{2}{9;\frac{a}{2}}=19.02\text{ et }X^{2}{9;1-\frac{a}{2}}=2.70
Man kann also das Konfidenzintervall der Varianz bei einem Konfidenzniveau von 95% berechnen.
\frac{(n-1)S^{2}}{X^{2}_{n-1;\frac{a}{2}}}\le \sigma^{2}\le \frac{(n-1)S^{2}}{X^{2}n-1;1-\frac{a}{2}}
\frac{90.489}{19.02}\le \sigma^{2}\le \frac{90.489}{2.70}
0,231 \c&H30D3F4&}} \c&H30D3F4&}}
0.480 \c&H30D3F4&} \c&H30D3F4&} \c&H30D3F4&} 1.276
Anteil
Das Konfidenzintervall eines Anteils ist ein Bereich von Werten, in dem ein Anteil einer bestimmten Population mit einer bestimmten Wahrscheinlichkeit liegen dürfte. Mit anderen Worten: Es ist ein aus den Daten einer Stichprobe konstruierter Wertebereich, innerhalb dessen der wahre Anteil der Population mit einem bestimmten Vertrauensniveau vermutet wird.
Es gibt verschiedene Methoden, um das Konfidenzintervall einer Proportion in der Statistik zu berechnen, aber die beiden am häufigsten verwendeten Methoden sind :
- Exakte Methode (für kleine Stichprobengrößen).
- Näherungsmethode (mit der Normalverteilung)
Exakte Methode: (Berechnung mit Hilfe der Binomialverteilung)
Die exakte Methode zur Berechnung des Konfidenzintervalls einer Proportion beruht auf der Binomialverteilung und liefert eine genaue Lösung ohne die Annäherungen, die durch asymptotische Methoden gemacht werden. Dies ist besonders nützlich bei kleinen Stichprobengrößen oder wenn der beobachtete Anteil (
𝑝ˆp^
) nahe bei 0 oder 1 liegt.
Hier sind die Schritte, um das genaue Konfidenzintervall des Anteils zu berechnen :
Schritt 1 : Berechnen Sie den Anteil, der in der Stichprobe n mit k Erfolgen beobachtet wurde.: 𝑝ˆ=𝑘𝑛p^=kn Bestimmen Sie die Grenzen des Konfidenzintervalls .
Schritt 2: Berechnen Sie die Quantile der Binomialverteilung. Diese Quantile grenzen das Konfidenzintervall ein. Für ein Konfidenzniveau von 1-α müssen Sie das Quantil Q1 zum Perzentil 𝛼2𝛼2und das Quantil Q2 zum Perzentil 1-𝛼21-𝛼2 aus der Tabelle der Binomialverteilung finden. Diese Quantile können mithilfe von Tabellen der Binomialverteilung oder in der Software Ellistat gefunden werden.
Schritt 3: Berechnen Sie das Konfidenzintervall: Das Konfidenzintervall wird mit der folgenden Formel berechnet: Dann berechnen Sie das Konfidenzintervall [𝑄1𝑛;𝑄2𝑛][Q1n;Q2n].
Beispiel: Nehmen wir an, dass Sie nach der Entnahme einer Stichprobe der Größe n=20 k=15 konforme Teile beobachtet haben. Berechnen Sie das genaue Konfidenzintervall für den Anteil der konformen Stücke bei einem Konfidenzniveau von 95)?
Lösung :
Der Anteil der beobachteten konformen Teile: 𝑝ˆ=1520=0.75p^=1520=0.75
Bestimmung von Q1 und Q2 , bei einem Anteil p=0,75 und einer Stichprobengröße von 20.
Unter Verwendung der Ellistat-Software findet man: Q1=11 (11 ergibt ein 𝛼/2, das am nächsten bei 0.025 liegt) und Q2=18
Das Konfidenzintervall des Anteils für ein Vertrauen von 95% ist: [𝑄1𝑛;𝑄2𝑛]= [1120;1820]Q1n;Q2n= [1120;1820].
Es ist wichtig zu beachten, dass diese Methode zwar eine genaue Lösung liefert, aber vor allem bei großen Stichprobengrößen rechenintensiver sein kann und oft die Verwendung einer Statistiksoftware zur Durchführung der Berechnungen erfordert.
Näherungsmethode (mit der Normalverteilung):
Um ein Konfidenzintervall für einen Anteil in einer Population zu konstruieren, verwendet man die Normalverteilung, wenn die Bedingungen des zentralen Grenzwertsatzes erfüllt sind. Wenn nämlich eine Stichprobe der Größe n aus einer Population gezogen wird, die der Binomialverteilung mit dem Parameter p folgt. Der aus dieser Stichprobe berechnete Anteil ist p^, wobei gilt: 𝑝ˆ=𝑥𝑛p^=xn
Mit :
- x: die Anzahl der Erfolge.
- n: die Größe der Stichprobe.
Der Mittelwert und die Standardabweichung der Bevölkerung sind wie folgt: 𝜇𝑝ˆ=𝑝
𝜎𝑝ˆ=𝑝 (1-𝑝)𝑛‾‾‾‾‾‾‾‾‾√𝜎p^=p (1-p)n
Der begrenzte Zentralsatz kann auf den Anteil der Stichproben angewendet werden, wenn 𝑛∗𝑝≥5n∗p≥5 und 𝑛∗(1-𝑝)≥5n∗(1-p)≥5. Dies ist nämlich besonders nützlich bei großen Stichprobengrößen oder wenn die beobachteten Anteile nicht in der Nähe von 1 und 0 liegen.
Die Z-Score-Formel kann daher angewendet werden: 𝜎𝑝ˆ=𝑝 (1-𝑝)𝑛‾‾‾‾‾‾‾‾‾√𝜎p^=p (1-p)n
Wenn0≤𝜇𝑝ˆ±2𝜎𝑝ˆ≤10≤𝜇p^±2𝜎p^≤1 , kann man davon ausgehen, dass 𝑝ˆp^ annähernd einer Normalverteilung folgt.