Un intervalle de confiance est une plage de valeurs plausible pour un paramètre statistique, estimée à partir d’un échantillon de données. Il donne une idée de la précision de notre estimation du paramètre. L’intervalle de confiance est généralement exprimé avec un niveau de confiance associé, qui représente la probabilité que l’intervalle contienne effectivement le vrai paramètre de la population.
Moyenne :
L’intervalle de confiance de la moyenne est un intervalle statistique qui donne une estimation plausible de l’intervalle dans lequel se trouve la vraie moyenne d’une population. Il est construit à partir des données d’un échantillon de cette population.
Certainement, la création d’un intervalle de confiance pour la moyenne est possible grâce au théorème central limite. Pour des échantillons de taille suffisamment grande (n≥30), quelle que soit la forme de distribution de la population, si plusieurs échantillons de taille « n » sont pris au hasard, les moyennes de ces échantillons \left{\overline{X} \right} sont approximativement distribuées de manière normale. Cela permet de construire des intervalles de confiance fiables pour estimer la vraie moyenne de la population.
La construction de l’intervalle de confiance de la moyenne repose sur l’utilisation de la distribution t de Student ou de la distribution normale, en fonction de la taille de l’échantillon et de la connaissance que nous avons sur l’écart-type de la population.
Puisque ce calcul est une approximation, il convient de connaitre la précision de cette approximation. En général pour caractériser la précision de cette approximation on calcule l’intervalle à 95%. Cet intervalle correspond à :
Intervalle à 95% = Intervalle dans lequel il y a 95% de chance que la vraie valeur de la moyenne de la distribution se trouve à l’intérieur.
Dans les statistiques 95% s’appelle la confiance (1- α), elle est complémentaire au risque de première espèce α=5%. Ce risque représente, la chance que la valeur de la moyenne de la distribution se trouve à l’extérieur de l’intervalle de confiance.
Voici comment construire un intervalle de confiance de la moyenne :
- Calcul de la moyenne et de l’écart-type de l’échantillon de taille « n » : À partir de l’échantillon de données, calculez la moyenne et l’écart-type de l’échantillon \overline{X} et S.
- Choix du niveau de confiance (1- α) : Sélectionnez un niveau de confiance, souvent exprimé en pourcentage, comme 95% ou 99%. Un niveau de confiance de 95% signifie que nous sommes confiants à 95% que l’intervalle que nous construisons contiendra la vraie moyenne de la population.
- Détermination de l’intervalle : Utilisez la formule de l’intervalle de confiance pour la moyenne en fonction de la distribution appropriée ( Student ou normale) :
- Si vous connaissez l’écart-type de la population 𝜎, utilisez la distribution normale :
- IC = \overline{X} \underline{+}Z_{\frac{a}{2}}\ast \frac{S}{\sqrt{n}} où:
- Z\frac{2}{a} : est le score z correspondant au niveau de confiance. (Bilatéral)
- n : est la taille de l’échantillon.
- IC = \overline{X} \underline{+}Z_{\frac{a}{2}}\ast \frac{S}{\sqrt{n}} où:
- Si vous ne connaissez pas l’écart-type de la population 𝜎, utilisez la distribution de Student :
- IC = \overline{X} \underline{+}t_{\frac{a}{2}n-1}\ast \frac{S}{\sqrt{n}} où:
- t_{\frac{a}{2}n-1} : est le score t correspondant au niveau de confiance et pour n-1 degré de liberté.
- n : est la taille de l’échantillon.
- IC = \overline{X} \underline{+}t_{\frac{a}{2}n-1}\ast \frac{S}{\sqrt{n}} où:
- Si vous connaissez l’écart-type de la population 𝜎, utilisez la distribution normale :
L’intervalle de confiance de la moyenne donne donc une plage de valeurs à l’intérieur de laquelle nous sommes confiants à un certain niveau de confiance (1−𝛼) que se trouve la véritable moyenne de la population µ. Plus le niveau de confiance est élevé, plus l’intervalle sera large, reflétant un degré plus élevé de confiance dans l’estimation.
Ecart-type S | Taille de l’échantillon n | Confiance (1-α) | |
Largeur de l’intervalle de confiance de la moyenne IC. | Largeur IC augmente si l’écart-type augmente | Largeur IC diminue si la taille l’échantillon augmente | Largeur de l’IC augmente quand la confiance augmente |
Exemple : On souhaite savoir calculer l’intervalle de confiance de la consommation moyenne du sucre par famille à 95% de confiance. Un échantillon de 18 familles a été prélevé. Ci-dessous le tableau des résultats :
5 | 13 | 11 | 5 | 2 | 3 | 2 | 1 | 6 | 14 | 6 | 8 | 2 | 13 | 9 | 5 | 12 | 7 |
Solution :
Calculons la moyenne, l’écart-type et le nombre de degrés de liberté
\overline{X} = \frac{5+13+11+5+2+3+2+1+6+14+6+8+2+13+9+5+12+7}{18} = 6.88
S = \sqrt{\frac{\sum_{1}^{N}(xi-\overline{x})^{2}}{17}} = 4.25
n-1 =17
Depuis la table de la loi de Student, ou avec le logiciel Ellistat Data Analysis, on trouve la valeur t=2.110
On peut donc déduire l’intervalle de confiance suivant :
\overline{X}-t_{\frac{a}{2};n-1}\ast \frac{S}{\sqrt{n}}\le \mu\le \overline{X}+t_{\frac{a}{2}n-1}\ast \frac{S}{}\sqrt{n}
6.88-2.110\ast \frac{4.25}{\sqrt{18}}\le \mu\le 6.88+2.110\ast \frac{4.25}{\sqrt{18}}
4.773\le \mu\le 9.005
Variance / Ecart-type:
Pour construire un intervalle de confiance pour la variance d’une population, on utilise la distribution du chi-2 (x^{2}). En effet on sait que la variance est estimée en utilisant formule suivante :
</p><p>La formule de chi-2 ([latex]x^{2} de la variance s’écrit comme suit :
X^{2} = \frac{(n-1)S^{2}}{\sigma^{2}}
La courbe de fonction de densité un de chi-2 (x^{2}) ressemble à une loi normale mais elle n’est pas symétrique. Et surtout sa forme dépend de nombre de degrés de liberté. Le graphique ci-dessous illustre le schéma de la fonction de densité de chi-2 (x^{2})pour un degré de liberté de n=4 .
La formule de x^{2} peut être exploitée pour déduire l’intervalle de confiance de la variance 𝜎², pour une taille de prélèvement n et une confiance 1-α.
\frac{(n-1)S^{2}}{X^{2}_{n-1;\frac{a}{2}}}\le \sigma^{2}\le \frac{(n-1)S^{2}}{X^{2}n-1;1-\frac{a}{2}}
Processus de calcul de l’intervalle de confiance de la variance :
- Calculez la variance et les degrés de liberté : À partir de l’échantillon de données, calculez la variance S², et les degrés de liberté (n-1).
- Trouvez les valeurs critiques du chi carré : Recherchez les valeurs critiques du chi carré X^{2}n-1;\frac{a}{2}\text{et}X^{2}n-1;1-\frac{a}{2} pour le niveau de confiance souhaité et les degrés de liberté. Vous pouvez trouver ces valeurs dans des tables de distribution du 𝜒2 ou à l’aide de Ellistat.
- Utiliser les formules suivantes pour déterminer l’intervalle de confiance de la variance :
\frac{(n-1)S^{2}}{X^{2}_{n-1;\frac{a}{2}}}\le \sigma^{2}\le \frac{(n-1)S^{2}}{X^{2}n-1;1-\frac{a}{2}}
NB : l’intervalle de confiance de l’écart-type peut être ainsi déduit, en mettant la racine de chaque côté.
\sqrt{\frac{(n-1)S^{2}}{X^{2}n-1;\frac{a}{2}}}\le \sigma\le \sqrt{\frac{(n-1)S^{2}}{X^{2}n-1;1-\frac{a}{2}}}
Exemple : un échantillon de 10 cylindres a été prélevé de la production. On souhaite avoir une idée sur la variabilité du process. Déterminer l’intervalle de confiance de la variance 𝜎2 pour une confiance de 95% :
10 | 10 | 12 | 10 | 11 |
10 | 11 | 11 | 10 | 11 |
Solution :
Calculons l’écart-type S et le nombre de degrés de liberté :
S^{2} = \frac{\sum_{1}^{N}(xi-\overline{x})^{2}}{9} = 0.489
n-1=9
Pour une confiance (1-α) de 95%, on peut déduire les valeurs des quantiles utilisés dans le calcul de l’intervalle de confiance de la variance :
\frac{\alpha}{2}=0.025\text{ et } 1-\frac{\alpha}{2} = 0.975
Depuis la table de la loi de 𝜒2, ou avec le logiciel Ellistat on trouve la valeur de X^{2}<em>{9;\frac{a}{2}}=19.02\text{ et }X^{2}</em>{9;1-\frac{a}{2}}=2.70
On peut donc calculer l’intervalle de confiance de la variance à une confiance de 95%.
\frac{(n-1)S^{2}}{X^{2}_{n-1;\frac{a}{2}}}\le \sigma^{2}\le \frac{(n-1)S^{2}}{X^{2}n-1;1-\frac{a}{2}}
\frac{9<em>0.489}{19.02}\le \sigma^{2}\le \frac{9</em>0.489}{2.70}
0.231\le \sigma^{2}\le 1.629
0.480\le \sigma\le 1.276
Proportion
L’intervalle de confiance d’une proportion est une plage de valeurs dans laquelle on estime qu’une proportion d’une population donnée est susceptible de se situer, avec une certaine probabilité. En d’autres termes, c’est un intervalle de valeurs construit à partir des données d’un échantillon, à l’intérieur duquel on estime que se trouve la véritable proportion de la population, avec un niveau de confiance donné.
Il existe différentes méthodes pour calculer l’intervalle de confiance d’une proportion en statistiques, mais les deux méthodes les plus couramment utilisées sont :
- Méthode exacte (pour les petites tailles d’échantillon).
- Méthode Approximative (avec la loi normale)
Méthode exacte : (calcul par la loi binomiale)
La méthode exacte pour calculer l’intervalle de confiance d’une proportion repose sur la distribution binomiale et fournit une solution précise sans les approximations faites par les méthodes asymptotiques. C’est particulièrement utile pour les petites tailles d’échantillon ou lorsque la proportion observée (
𝑝ˆp^
) est proche de 0 ou 1.
Voici les étapes pour calculer l’intervalle de confiance exact de la proportion :
Etape 1 : Calculer la proportion observée sur l’échantillon n avec k succès. : 𝑝ˆ=𝑘𝑛p^=kn Déterminer les bornes de l’intervalle de confiance .
Etape 2: Calculez les quantiles de la distribution binomiale. Ces quantiles délimitent l’intervalle de confiance. Pour un niveau de confiance de 1−α, vous devez trouver le quantile Q1 au percentile 𝛼2𝛼2puis le quantile Q2 au percentile 1−𝛼21−𝛼2 à partir de la table de la loi Binomiale. Ces quantiles peuvent être trouvés à l’aide de tables de la distribution binomiale ou dans le logiciel Ellistat.
Etape 3: Calculer l’intervalle de confiance : L’intervalle de confiance est calculé avec la formule suivante : Puis calculer l’intervalle de de confiance [𝑄1𝑛;𝑄2𝑛][Q1n;Q2n]
Exemple : supposons qu’après prélèvent d’un échantillon de taille n=20, vous avez observé k=15 conformes. Calculer l’intervalle de confiance exacte de la proportion des pièces conformes pour une confiance de 95) ?
Solution :
La proportion des pièces conformes observée : 𝑝ˆ=1520=0.75p^=1520=0.75
Détermination de Q1 et Q2 , pour une proportion p=0.75 et une taille de prélèvement de 20.
En utilisant le logiciel Ellistat on trouve : Q1=11 (11 donne un 𝛼/2 le plus proche à 0.025) et Q2=18
L’intervalle de confiance de la proportion pour une confiance de 95% est : [𝑄1𝑛;𝑄2𝑛]= [1120;1820]Q1n;Q2n= [1120;1820]
Il est important de noter que cette méthode donne une solution précise, mais elle peut être plus intensive en termes de calcul, en particulier pour les grandes tailles d’échantillon, nécessitant souvent l’utilisation d’un logiciel statistique pour effectuer les calculs.
Méthode Approximative (avec la loi normale):
Pour construire un intervalle de confiance pour une proportion dans une population, on utilise la distribution normale si les conditions du théorème central limite sont satisfaites. En effet si un échantillon de taille n est prélevé d’une population qui suit la loi Binomiale de paramètre p. La proportion calculée à partir de cet échantillon est p^, sachant que : 𝑝ˆ=𝑥𝑛p^=xn
Avec :
- x : le nombre de succès.
- n : la taille de l’échantillon.
La moyenne et l’écart-type de la population sont les suivants : 𝜇𝑝ˆ=𝑝
𝜎𝑝ˆ=𝑝 (1−𝑝)𝑛‾‾‾‾‾‾‾‾‾√𝜎p^=p (1−p)n
Le théorème central limité peut être appliqué sur la proportion des échantillons si 𝑛∗𝑝≥5n∗p≥5 et 𝑛∗(1−𝑝)≥5n∗(1−p)≥5. En effet, c’est particulièrement utile pour les grandes tailles d’échantillon ou lorsque les proportions observées ne sont pas proches de 1 et 0.
La formule de Z-score peut être donc appliquée : 𝜎𝑝ˆ=𝑝 (1−𝑝)𝑛‾‾‾‾‾‾‾‾‾√𝜎p^=p (1−p)n
Si0≤𝜇𝑝ˆ±2𝜎𝑝ˆ≤10≤𝜇p^±2𝜎p^≤1 , on peut considérer que 𝑝ˆp^ suit approximativement une loi normale.