Bizonossági intervallum

Olvasási idő

A konfidenciaintervallum egy statisztikai paraméter egy statisztikai mintából becsült, valószínűsíthető értéktartománya. A paraméter becslésének pontosságáról ad képet. A konfidenciaintervallumot általában a hozzá tartozó konfidenciaszinttel fejezik ki, amely annak a valószínűségét jelenti, hogy az intervallum valóban tartalmazza a valódi populációs paramétert. 

Átlagos : 

Az átlag konfidenciaintervalluma egy olyan statisztikai intervallum, amely egy valószínűsíthető becslést ad arra az intervallumra, amelyen belül a populáció valódi átlaga fekszik. Ezt az intervallumot a sokaság mintájából származó adatok felhasználásával állítják össze.  

Természetesen az átlagra vonatkozó konfidenciaintervallum létrehozása lehetséges a központi határértéktételnek köszönhetően. Megfelelően nagy minták esetén (n≥30), függetlenül a populáció eloszlásának alakjától, ha véletlenszerűen több "n" méretű mintát veszünk, e minták átlagai \left{overline{X} \right} megközelítőleg normális eloszlásúak. Ez lehetővé teszi, hogy megbízható konfidenciaintervallumokat alkossunk a sokaság valódi átlagának becslésére. 

Az átlagra vonatkozó konfidenciaintervallum megalkotása a Student-féle t-eloszlás vagy a normális eloszlás alkalmazásán alapul, a minta méretétől és a populáció szórásáról való ismereteinktől függően. 

Mivel ez a számítás egy közelítés, ismernünk kell a közelítés pontosságát. Általánosságban, hogy jellemezzük e közelítés pontosságát, kiszámítjuk a 95%-nél lévő intervallumot. Ez az intervallum megfelel : 

95% intervallum = olyan intervallum, amelyben 95% esély van arra, hogy az eloszlás átlagának valódi értéke ezen belül van. 

A statisztikában 95% a bizalom (1- α), amely kiegészíti az α=5% elsőfajú kockázatot. Ez a kockázat annak az esélyét jelenti, hogy az eloszlás átlagának értéke a konfidenciaintervallumon kívül esik. 

Az alábbiakban bemutatjuk, hogyan kell konfidenciaintervallumot konstruálni az átlaghoz: 

  1. Az "n" méretű minta átlagának és szórásának kiszámítása: A minta adatainak felhasználásával számítsa ki a minta átlagát és szórását. \overline{X} és S. 
  2. A megbízhatósági szint kiválasztása (1- α): Válasszon ki egy megbízhatósági szintet, gyakran százalékban kifejezve, például 95% vagy 99%. A 95% megbízhatósági szint azt jelenti, hogy 95% biztosak vagyunk abban, hogy az általunk konstruált intervallum tartalmazza a valódi populációs átlagot. 
  3. Az intervallum meghatározása: Használja a megfelelő eloszlás (Student vagy normál eloszlás) szerinti középérték bizalmi intervallumának képletét: 
    • Ha ismeri a populáció 𝜎 szórását, használja a normális eloszlást:
      • IC = \overline{X} \underline{+}Z_{\frac{a}{2}}\ast \frac{S}{\sqrt{n}} ahol:
        • Z\frac{2}{a} a bizalmi szintnek megfelelő z-pontszám. (Kétoldalú)
        • n: a minta mérete. 
    • Ha nem ismeri a populáció 𝜎 szórását, használja a Student-eloszlást: 
      • IC = \overline{X} \underline{+}t_{\frac{a}{2}n-1}\ast \frac{S}{\sqrt{n}} ahol:
        • t_{rac{a}{2}n-1}a megbízhatósági szintnek megfelelő t-pontszám n-1 szabadsági fok esetén.  
        • n: a minta mérete. 

Az átlag konfidenciaintervalluma tehát azoknak az értékeknek a tartományát adja meg, amelyeken belül egy bizonyos megbízhatósági szinten (1-𝛼) biztosak vagyunk abban, hogy a µ populáció valódi átlaga van. Minél magasabb a megbízhatósági szint, annál szélesebb lesz az intervallum, ami a becslésbe vetett nagyobb fokú bizalmat tükrözi. 

 Standard eltérés S Minta mérete n Bizalom (1-α) 
Az átlagos IC konfidenciaintervallumának szélessége. Az IC szélessége nő, ha a standard eltérés nő Az IC szélessége csökken a minta méretének növekedésével A CI szélessége a bizalom növekedésével nő 

Példa: Szeretnénk tudni, hogyan lehet kiszámítani a családonkénti átlagos cukorfogyasztás konfidenciaintervallumát 95% konfidencia mellett. Egy 18 családból álló mintát vettünk. Az alábbi táblázatban az eredmények szerepelnek: 

13 11 14 13 12 

Megoldás: 

Számítsuk ki az átlagot, a szórást és a szabadságfokok számát. 

\overline{X} = \frac{5+13+11+5+2+3+2+1+6+14+6+8+2+13+9+5+12+7}{18} = 6.88

S = \sqrt{\frac{\sum_{1}^{N}(xi-\overline{x})^{2}}{17}}} = 4.25

n-1 =17

A Student's law táblázatból, vagy a szoftver segítségével Ellistat adatelemzésa t=2.110 értéket találjuk

Szöveget, diagramot, képernyőképet, automatikusan generált PlotDescription képet tartalmazó kép

Ezért levezethetjük a következő konfidenciaintervallumot: 

\overline{X}-t_{\frac{a}{2};n-1}\ast \frac{S}{\sqrt{n}}}\le \mu\le \overline{X}+t_{\frac{a}{2}n-1}\ast \frac{S}{\sqrt{n}}

6.88-2.110\ast \frac{4.25}{\sqrt{18}}

4.773 \mu\le 9.005

Szórás / szórás:

A populáció szórására vonatkozó konfidenciaintervallum megalkotásához a chi-2 eloszlást használjuk (x^{2}). Tudjuk, hogy a variancia becslése a következő képlettel történik: 

</p><p>A chi-2 képlet ([latex]x^{2} a variancia a következőképpen írható fel : 

X^{2} = \frac{(n-1)S^{2}}}{sigma^{2}}

A chi-2 sűrűségfüggvény görbéje (x^{2}) hasonlít a normális eloszlásra, de nem szimmetrikus. Alakja mindenekelőtt a szabadságfokok számától függ. Az alábbi grafikon a chi-2 sűrűségfüggvény (x^{2})n=4 szabadsági fok esetén. 

A x^{2} használható a variancia 𝜎² konfidenciaintervallumának levezetésére, n mintaméret és 1-α konfidencia esetén. 

\frac{(n-1)S^{2}}{X^{2}_{n-1;\frac{a}{2}}}\le \sigma^{2}\le \frac{(n-1)S^{2}}{X^{2}n-1;1-\frac{a}{2}}

A variancia konfidenciaintervallumának kiszámítási eljárása : 

  1. A szórás és a szabadságfokok kiszámítása: A mintaadatokból számítsa ki az S² szórást és a szabadságfokokat (n-1). 
  2. A kritikus chi-négyzet értékek meghatározása: A kritikus chi-négyzet értékek meghatározása X^{2}n-1;\frac{a}{2}\text{et}X^{2}n-1;1-\frac{a}{2} a kívánt megbízhatósági szint és szabadságfok esetén. Ezeket az értékeket a 𝜒2 eloszlási táblázatokban vagy az Ellistat segítségével találhatja meg. 
  3. A variancia konfidenciaintervallumának meghatározásához használja a következő képleteket: 

\frac{(n-1)S^{2}}{X^{2}_{n-1;\frac{a}{2}}}\le \sigma^{2}\le \frac{(n-1)S^{2}}{X^{2}n-1;1-\frac{a}{2}}

Megjegyzés: a szórás konfidenciaintervallumát úgy lehet levezetni, hogy a gyökeret mindkét oldalra helyezzük. 

\sqrt{\frac{(n-1)S^{2}}{X^{2}n-1;\frac{a}{2}}}\le \sigma\le \sqrt{\frac{(n-1)S^{2}}{X^{2}n-1;1-\frac{a}{2}}}

Példa: 10 palackból álló mintát vettek a gyártásból. Szeretnénk képet kapni a folyamat változékonyságáról. Határozza meg az 𝜎2 variancia konfidenciaintervallumát 95% konfidencia mellett: 

10 10 12 10 11 
10 11 11 10 11 

Megoldás:  

Számítsuk ki az S szórást és a szabadságfokok számát : 

S^{2} = \frac{\sum_{1}^{N}(xi-\overline{x})^{2}}{9} = 0.489

n-1=9 

A 95% (1-α) konfidenciaszint esetén levezethetjük a variancia konfidenciaintervallumának kiszámításához használt kvantilisek értékeit: 

\frac{\alpha}{2}=0.025\text{ és } 1-\frac{\alpha}{2} = 0.975

A 𝜒2 törvény táblázatából, vagy az Ellistat szoftverrel meg lehet találni az értéket.   X^{2}{9;\frac{a}{2}}=19.02\text{ et }X^{2}{9;1-\frac{a}{2}}=2.70

Ezért kiszámíthatjuk a variancia konfidenciaintervallumát 95% konfidenciaszinten. 

\frac{(n-1)S^{2}}{X^{2}_{n-1;\frac{a}{2}}}\le \sigma^{2}\le \frac{(n-1)S^{2}}{X^{2}n-1;1-\frac{a}{2}}

\frac{90.489}{19.02}\le \sigma^{2}\le \frac{90.489}{2.70}

0.231 \sigma^{2}\le 1.629

0,480 \sigma\le 1,276

Arány

Egy arány konfidenciaintervalluma olyan értéktartomány, amelyen belül egy adott sokaság egy adott arányának egy bizonyos valószínűséggel való becslése van. Más szóval, ez egy olyan, mintaadatokból konstruált értékintervallum, amelyen belül a sokaság valódi aránya becslések szerint egy adott megbízhatósági szinttel van. 

A statisztikában különböző módszerek léteznek egy arány konfidenciaintervallumának kiszámítására, de a két leggyakrabban használt módszer a következő: 

  • Pontos módszer (kis mintanagyság esetén). 
  • Megközelítő módszer (normális eloszlással) 

Pontos módszer(számítás binomiális eloszlással) 

Az arányok konfidenciaintervallumának kiszámítására szolgáló pontos módszer a binomiális eloszláson alapul, és pontos megoldást nyújt az aszimptotikus módszerek által alkalmazott közelítések nélkül. Ez különösen hasznos kis mintanagyság esetén, vagy ha a megfigyelt arány (

𝑝ˆp^

) közel 0 vagy 1. 

Az arány pontos konfidenciaintervallumának kiszámításához a következő lépések szükségesek: 

1. lépés: Számítsa ki az n mintán megfigyelt arányt k sikerrel.𝑝ˆ=𝑘𝑘𝑛p^=kn Határozzuk meg a konfidenciaintervallum határait .

2. szakaszSzámítsa ki a binomiális eloszlás kvantiliseit. Ezek a kvantilisek határolják a konfidenciaintervallumot. 1-α konfidenciaszint esetén a binomiális eloszlás táblázatából meg kell találnia a Q1 kvantilisét a 𝛼2𝛼2 percentilisnél, majd a Q2 kvantilisét az 1-𝛼21-𝛼2 percentilisnél. Ezeket a kvantiliseket a binomiális eloszlás táblázataival vagy az Ellistat szoftverben lehet megtalálni. 

3. lépés: A konfidenciaintervallum kiszámítása: A konfidenciaintervallum kiszámítása a következő képlet segítségével történik: Ezután számítsa ki a konfidenciaintervallumot [𝑄1𝑛;𝑄2𝑛][Q1n;Q2n].  

Példa: Tegyük fel, hogy egy n=20 méretű minta felvétele után k=15 megfelelő alkatrészt figyelt meg. Számítsa ki a megfelelő alkatrészek arányának pontos konfidenciaintervallumát 95-ös konfidenciaszint mellett)? 

Megoldás: 

A megfigyelt megfelelő alkatrészek aránya: 𝑝ˆ=1520=0,75p^=1520=0,75

A Q1 és Q2 meghatározása p=0,75 arány és 20 fős mintanagyság esetén. 

Az Ellistat szoftver segítségével a következőket találjuk: Q1=11 (11 a 0,025-hez legközelebbi 𝛼/2 értéket adja) és Q2=18. 

Szöveget tartalmazó kép, képernyőkép, diagram, automatikusan generált vonalleírás

Szöveget, diagramot, vonalat vagy automatikusan generált PlotDescription képet tartalmazó kép.

Az arány konfidenciaintervalluma 95% konfidencia esetén: [𝑄1𝑛;𝑄2𝑛]= [1120;1820]Q1n;Q2n= [1120;1820]

Fontos megjegyezni, hogy ez a módszer pontos megoldást ad, de számításigényesebb lehet, különösen nagy mintanagyság esetén, és gyakran statisztikai szoftver használata szükséges a számítások elvégzéséhez. 

Megközelítő módszer (normális eloszlással):  

Egy populációban lévő arányra vonatkozó konfidenciaintervallum megalkotásához a normális eloszlást használjuk, ha a központi határértéktétel feltételei teljesülnek. Ha egy n méretű mintát veszünk egy olyan sokaságból, amely a p paraméterű binomiális eloszlást követi, akkor az ebből a mintából számított arány p^, feltéve, hogy: 𝑝ˆ=𝑥𝑛p^=xn

A :  

  • x: a sikerek száma. 
  • n: a minta mérete. 

A populáció átlaga és szórása 𝜇𝑝ˆ=𝑝

𝜎𝑝ˆ=𝑝 (1-𝑝)𝑛‾‾‾‾‾‾‾‾‾√𝜎p^=p (1-p)n

A korlátozott centrális tétel alkalmazható a minták arányára, ha 𝑛∗𝑝≥5n∗p≥5 és 𝑛∗∗(1-𝑝)≥5n∗(1-p)≥5. Ez valóban különösen hasznos nagy mintanagyságok esetén, vagy amikor a megfigyelt arányok nem közelítik meg az 1-et és a 0-t. 

A Z-pontszám képlet tehát alkalmazható: 𝜎𝑝ˆ=𝑝 (1-𝑝)𝑛‾‾‾‾‾‾‾‾‾√𝜎p^=p (1-p)n

Ha0≤𝜇𝑝ˆ±2𝜎𝑝ˆ≤10≤𝜇p^±2𝜎p^≤1 , akkor úgy tekinthetjük, hogy 𝑝ˆp^ megközelítőleg normális eloszlást követ.