Intervalle de confiance

Temps de lecture

Un intervalle de confiance est une plage de valeurs plausible pour un paramètre statistique, estimée à partir d’un échantillon de données. Il donne une idée de la précision de notre estimation du paramètre. L’intervalle de confiance est généralement exprimé avec un niveau de confiance associé, qui représente la probabilité que l’intervalle contienne effectivement le vrai paramètre de la population. 

Moyenne : 

L’intervalle de confiance de la moyenne est un intervalle statistique qui donne une estimation plausible de l’intervalle dans lequel se trouve la vraie moyenne d’une population. Il est construit à partir des données d’un échantillon de cette population.  

Certainement, la création d’un intervalle de confiance pour la moyenne est possible grâce au théorème central limite. Pour des échantillons de taille suffisamment grande (n≥30), quelle que soit la forme de distribution de la population, si plusieurs échantillons de taille « n » sont pris au hasard, les moyennes de ces échantillons \left{\overline{X} \right} sont approximativement distribuées de manière normale. Cela permet de construire des intervalles de confiance fiables pour estimer la vraie moyenne de la population. 

La construction de l’intervalle de confiance de la moyenne repose sur l’utilisation de la distribution t de Student ou de la distribution normale, en fonction de la taille de l’échantillon et de la connaissance que nous avons sur l’écart-type de la population. 

Puisque ce calcul est une approximation, il convient de connaitre la précision de cette approximation. En général pour caractériser la précision de cette approximation on calcule l’intervalle à 95%. Cet intervalle correspond à : 

Intervalle à 95% = Intervalle dans lequel il y a 95% de chance que la vraie valeur de la moyenne de la distribution se trouve à l’intérieur. 

Dans les statistiques 95% s’appelle la confiance (1- α), elle est complémentaire au risque de première espèce α=5%. Ce risque représente, la chance que la valeur de la moyenne de la distribution se trouve à l’extérieur de l’intervalle de confiance. 

Voici comment construire un intervalle de confiance de la moyenne : 

  1. Calcul de la moyenne et de l’écart-type de l’échantillon de taille « n » : À partir de l’échantillon de données, calculez la moyenne et l’écart-type de l’échantillon \overline{X} et S. 
  2. Choix du niveau de confiance (1- α) : Sélectionnez un niveau de confiance, souvent exprimé en pourcentage, comme 95% ou 99%. Un niveau de confiance de 95% signifie que nous sommes confiants à 95% que l’intervalle que nous construisons contiendra la vraie moyenne de la population. 
  3. Détermination de l’intervalle : Utilisez la formule de l’intervalle de confiance pour la moyenne en fonction de la distribution appropriée ( Student ou normale) : 
    • Si vous connaissez l’écart-type de la population 𝜎, utilisez la distribution normale :
      • IC = \overline{X} \underline{+}Z_{\frac{a}{2}}\ast \frac{S}{\sqrt{n}} où:
        • Z\frac{2}{a} : est le score z correspondant au niveau de confiance. (Bilatéral)
        • n : est la taille de l’échantillon. 
    • Si vous ne connaissez pas l’écart-type de la population 𝜎, utilisez la distribution de Student : 
      • IC = \overline{X} \underline{+}t_{\frac{a}{2}n-1}\ast \frac{S}{\sqrt{n}} où:
        • t_{\frac{a}{2}n-1} : est le score t correspondant au niveau de confiance et pour n-1 degré de liberté.  
        • n : est la taille de l’échantillon. 

L’intervalle de confiance de la moyenne donne donc une plage de valeurs à l’intérieur de laquelle nous sommes confiants à un certain niveau de confiance (1−𝛼) que se trouve la véritable moyenne de la population µ. Plus le niveau de confiance est élevé, plus l’intervalle sera large, reflétant un degré plus élevé de confiance dans l’estimation. 

 Ecart-type S Taille de l’échantillon n Confiance (1-α) 
Largeur de l’intervalle de confiance de la moyenne IC. Largeur IC augmente si l’écart-type augmente Largeur IC diminue si la taille l’échantillon augmente Largeur de l’IC augmente quand la confiance augmente 

Exemple : On souhaite savoir calculer l’intervalle de confiance de la consommation moyenne du sucre par famille à 95% de confiance. Un échantillon de 18 familles a été prélevé. Ci-dessous le tableau des résultats : 

13 11 14 13 12 

Solution : 

Calculons la moyenne, l’écart-type et le nombre de degrés de liberté 

\overline{X} = \frac{5+13+11+5+2+3+2+1+6+14+6+8+2+13+9+5+12+7}{18} = 6.88

S = \sqrt{\frac{\sum_{1}^{N}(xi-\overline{x})^{2}}{17}} = 4.25

n-1 =17

Depuis la table de la loi de Student, ou avec le logiciel Ellistat on trouve la valeur de t_{\frac{a}{2}}; 17 = 2.110 
Une image contenant texte, diagramme, capture d’écran, TracéDescription générée automatiquement 

On peut donc déduire l’intervalle de confiance suivant : 

\overline{X}-t_{\frac{a}{2};n-1}\ast \frac{S}{\sqrt{n}}\le \mu\le \overline{X}+t_{\frac{a}{2}n-1}\ast \frac{S}{}\sqrt{n}

6.88-2.110\ast \frac{4.25}{\sqrt{18}}\le \mu\le 6.88+2.110\ast \frac{4.25}{\sqrt{18}}

4.773\le \mu\le 9.005