La distribución hipergeométrica es una distribución de probabilidad discreta que modela el número de aciertos en una muestra de tamaño fijo extraída sin reemplazamiento de una población finita que contiene un número especificado de objetos de aciertos y fallos. Suele utilizarse para modelizar situaciones en las que la selección no es independiente, ya que cada extracción afecta a la composición de la población.
Estas son las principales características de la ley hipergeométrica:
- Población finita La población total contiene un número fijo de objetos, por ejemplo, cartas, canicas, monedas, etc.
- Objetos de éxito y fracaso La población se divide en dos grupos: objetos de éxito (por ejemplo, cartas marcadas, canicas ganadoras) y objetos de fracaso (por ejemplo, cartas sin marcar, canicas perdedoras).
- Dibujo sin sustitución La muestra se extrae sin devolver los objetos a la población después de cada extracción. Esto significa que la probabilidad de extraer un objeto cambia después de cada extracción.
La función de masa de probabilidad (PMF) de la distribución hipergeométrica viene dada por la fórmula :
𝑃(𝑋=𝑘)=𝐶𝐾𝑘∗𝐶𝑁-𝐾𝑛-𝑘𝐶𝑁𝑛PX=k=CkK∗Cn-kN-KCnN
donde :
- N es el tamaño total de la población,
- K es el número de objetos que han tenido éxito en la población,
- n es el tamaño de la muestra,
- k es el número de aciertos de la muestra,
La media (expectativa) de la distribución hipergeométrica es :
\mu=n*\frac{K}{N}
La varianza de una distribución binomial es :
\sigma=n\frac{K(N-K)*(N-n)}{N^{2}(N-1)}
La ley hipergeométrica se utiliza en diversos campos, como la estadística, la genética, la economía y otros ámbitos en los que se extraen muestras sin reemplazo de una población finita. Se diferencia de la distribución binomial en que tiene en cuenta los cambios en la probabilidad de éxito con cada extracción.