En statistiques, la loi normale (ou distribution normale) est l’une des distributions de probabilité les plus importantes et couramment utilisées. Elle est également connue sous le nom loi naturelle, ou distribution gaussienne, en l’honneur du mathématicien Carl Friedrich Gauss qui a étudié en détail ses propriétés.
La distribution normale est caractérisée par sa forme en cloche symétrique, ce qui signifie que la plupart des valeurs se regroupent autour de la moyenne, et les valeurs s’éloignent de la moyenne à mesure qu’elles deviennent plus grandes ou plus petites. La distribution normale est définie par deux paramètres :
- Moyenne (µ) : C’est le centre de la cloche, représentant la valeur autour de laquelle les autres valeurs se regroupent.
- Écart-type (σ) : C’est une mesure de la dispersion des valeurs par rapport à la moyenne. Plus l’écart-type est grand, plus la dispersion des valeurs est importante.
La fonction de densité de probabilité de la distribution normale est donnée par la formule mathématique suivante pour une variable aléatoire :
f(x)=\frac{1}{\sigma\sqrt{2\pi}}e^{-\frac{(x-\mu)^{2}}{2\sigma^{2}}}
Cette distribution a plusieurs propriétés importantes :
- Symétrie : La distribution est symétrique par rapport à sa moyenne.
- Forme en cloche : La plupart des valeurs se trouvent près de la moyenne, et la probabilité de valeurs extrêmes diminue rapidement à mesure que l’on s’éloigne de la moyenne.
- 68-95-99.7 Règle : Environ 68% des valeurs se situent à un écart-type de la moyenne, 95% à deux écart-types et 99.7% à trois écart-types.
- La distribution normale est utilisée dans de nombreux domaines de la statistique, y compris l’inférence statistique, la modélisation et les tests d’hypothèses, en raison de ses propriétés mathématiques bien connues et de sa fréquence d’apparition dans de nombreux phénomènes naturels et expérimentaux.
Loi normale centrée réduite
La loi « normale centrée réduite » fait référence à une distribution normale standardisée, c’est-à-dire une distribution normale avec une moyenne de 0 et un écart-type de 1. C’est l’une des distributions les plus couramment utilisées en statistiques.
En effet toute variable normale peut être transformée en une normale centrée réduite en soustrayant la moyenne de la variable et en divisant par l’écart-type. Cette normalisation est utile car elle permet de comparer des variables qui initialement peuvent avoir des unités différentes ou des échelles différentes. De plus, elle simplifie les calculs dans de nombreux contextes statistiques.
Pour une variable aléatoire X suivant une distribution normale avec une moyenne μ et un écart-type σ. La normalisation de X pour obtenir la normale centrée réduite (souvent notée Z) se fait en utilisant la formule :
Z=\frac{X-\mu}{\sigma}
La valeur de Z représente le décalage en nombre d’écart-type par rapport à la moyenne. Elle peut être positive ou négative.
- Une valeur de Z=2, signifie que ce point est supérieur à la moyenne µ et le décalage par rapport à cette dernière est de 2 écart-types σ.
- Une valeur de Z=-3.5, signifie que ce point est inférieur à la moyenne µ et le décalage par rapport à cette dernière est de 3.5 écart-types σ.
Avec cette transformation, on va pouvoir utiliser la table de la loi normale centrée réduite. Cette table permet de déterminer les valeurs de la fonction de répartition de la loi normale F(x) en fonction de la valeur de Z.
F(Z)=\int_{-\infty }^{Z}\frac{1}{\sqrt{2\Pi}}e^{-\frac{u^{2}}{2}}
Avec :
- F(Z) : La fonction de répartition de la loi normale standard (ou normale centrée réduite). Elle est une fonction mathématique qui donne la probabilité qu’une variable aléatoire suivant une distribution normale standard soit inférieure ou égale à une valeur donnée.
𝐹(𝑍)=𝑃(𝑧 ≤ 𝑍)
La valeur de F(Z) est toujours comprise entre 0 et 1, car il s’agit d’une probabilité.
Les valeurs de la fonction de répartition F(Z) pour la distribution normale standard sont utilisées dans de nombreux domaines de la statistique pour effectuer des calculs de probabilité, notamment dans les tests d’hypothèses, intervalles de confiance, l’estimation du taux de non-conformité, l’estimation de la fiabilité des processus et d’autres analyses statistiques.
La fonction de répartition F(Z) ne peut pas être exprimée en termes de fonctions élémentaires (telles que polynômes, exponentielles ou trigonométriques) et nécessite souvent l’utilisation de tables statistiques ou de logiciels informatiques pour calculer les valeurs de probabilité associées à des valeurs spécifiques de Z. Dans le cas de la loi normale, la table de loi normale centrée réduite, appelée aussi la table de Z sera utilisée pour le calcul de F(Z) :
Exemple :
Trouver les valeurs des probabilités suivantes en utilisant la loi normale :
𝑃(𝑧≤0), 𝑃(𝑧≤−2), 𝑃(𝑧≥1.55), 𝑃(−2≤ 𝑧 ≤1.55)
Solution :
Probabilité |
𝑃(𝑧≤0) = 0.5Pz ≤ 0 = 0.5 |
𝑃(𝑧≤−2)=𝑃(2≤𝑧)=1−𝑃(𝑧≤2) = 1−0.9772=0.0228 |
𝑃(𝑧≥1.55) = 1−𝑃(𝑧≤1.55)= 1−0.9394 = 0,0606 |
𝑃(−2≤𝑧≤1.55) = 𝑃(𝑧≤1.55)−𝑃(𝑧≤−2) = 0.9394−0.0228 = 0.9166 |
Calcul du pourcentage hors tolérance
Comme abordé lors de l’établissement des caractéristiques de la distribution normale, celle-ci est pleinement caractérisée dès que sa moyenne et son écart-type sont connus. Plus spécifiquement :
- Environ 68.27% des observations se situent à l’intérieur d’un écart-type de la moyenne.
- Environ 95.45% des observations se situent à l’intérieur de deux écarts-types de la moyenne.
- Environ 99.73% des observations se situent à l’intérieur de trois écarts-types de la moyenne.
Ces pourcentages décrivent la façon dont les données sont réparties autour de la moyenne dans une distribution normale, fournissant des indications précieuses sur la dispersion des valeurs par rapport à la moyenne.
Cependant, pour évaluer plus précisément le pourcentage d’éléments en dehors des limites tolérées dans une population, il est possible d’utiliser le calcul du nombre z.
Le nombre z se calcule ainsi :
Z = \frac{\mu-\text{tolérance}}{\sigma}
Il représente la mesure en termes d’écart-types entre la valeur moyenne de l’échantillon et la limite de tolérance.
Une fois le nombre z déterminé, il est possible de calculer le pourcentage d’éléments hors tolérance en se référant à la table de Gauss ou à la table de la distribution normale centrée réduite. Cette table permet de trouver la proportion des valeurs au-delà d’une certaine distance (représentée par le nombre z) de la moyenne dans une distribution normale, ce qui aide à évaluer le pourcentage d’éléments en dehors des limites tolérées.
Exemple :
Trouver le pourcentage hors tolérance total, sachant que le diamètre moyen est µ=10.1mm et l’écart type σ=0.5mm et l’intervalle de tolérance IT=[9 ; 11].
Calculons le zmin :
Z_{min} = \frac{\mu-\text{tolérance}}{\sigma} = \frac{10.1-9}{0.5} = 2.2
On en déduit le pourcentage de pièces hors tolérance min dans la table de Gauss :
% HT min = 100% – 98.61% = 1.39%
Calculons le zmax :
Z_{max} = \frac{\mu-\text{tolérance}}{\sigma} = \frac{10.1-11}{0.5} = 1.8
On en déduit le pourcentage de pièces hors tolérance max dans la table de Gauss :
% HT max =100%−98,61% = 3.59%
On déduit donc le pourcentage hors tolérance total :
% HT= % HTmin +% HTmax
% HT = 1.39%+3.59%≈5%