A hipergeometriai eloszlás egy diszkrét valószínűségi eloszlás, amely a sikerek számát modellezi egy meghatározott számú sikeres és sikertelen objektumot tartalmazó véges populációból pótlás nélkül vett, rögzített méretű mintában. Gyakran használják olyan helyzetek modellezésére, ahol a szelekció nem független, mivel minden egyes húzás befolyásolja a populáció összetételét.
Íme a hipergeometriai törvény legfontosabb jellemzői:
- Véges populáció A teljes populáció meghatározott számú tárgyat tartalmaz, például kártyákat, golyókat, érméket stb.
- A siker és a kudarc tárgyai A populáció két csoportra oszlik: sikerobjektumok (pl. megjelölt kártyák, nyertes golyók) és kudarcobjektumok (pl. nem megjelölt kártyák, vesztes golyók).
- Rajzolás csere nélkül A mintát úgy sorsoljuk ki, hogy a tárgyakat minden egyes sorsolás után nem visszaadjuk a populációnak. Ez azt jelenti, hogy egy tárgy kihúzásának valószínűsége minden egyes húzás után változik.
A hipergeometriai eloszlás valószínűségi tömegfüggvényét (PMF) a következő képlet adja meg:
𝑃(𝑋=𝑘)=𝐶𝐾𝑘∗𝐶𝑁-𝐾𝑛-𝑘𝐶𝑁𝑛PX=k=CkK∗Cn-kN-KCnN
ahol :
- N a teljes populáció mérete,
- K a sikeres objektumok száma a populációban,
- n a minta mérete,
- k a mintában szereplő sikerek száma,
A hipergeometriai eloszlás átlaga (várakozása) :
\mu=n*\frac{K}{N}
A binomiális eloszlás szórása :
\sigma=n\frac{K(N-K)*(N-n)}{N^{2}(N-1)}
A hipergeometriai törvényt számos területen használják, például a statisztikában, a genetikában, a közgazdaságtanban és más olyan területeken, ahol a mintákat csere nélkül húzzák ki egy véges sokaságból. Abban különbözik a binomiális eloszlástól, hogy figyelembe veszi a siker valószínűségének változását minden egyes húzásnál.