Lorsque l’on souhaite étudier des données, on cherche en général à comparer un échantillon à une valeur théorique ou comparer plusieurs échantillons entre eux. Le meilleur moyen de faire cette comparaison est d’utiliser un test statistique.

Un test statistique (ou test d’hypothèse) consiste à détecter une différence significative :

  • Entre une population étudiée et une valeur cible (Test de comparaison à une valeur théorique ou test de conformité).
  • Entre deux populations (Test de comparaison de population ou test d’homogénéité)
  • Concernant la liaison de deux variables (test de corrélation ou d’association)
  • Vis-à-vis de la compatibilité des données par rapport à une loi de distribution (test d’adéquation)

A partir d’un échantillonnage de données, le test statistique va calculer la probabilité d’obtenir une telle configuration d’échantillons en supposant que les données sont :

  • Conformes à la cible dans le cas d’un test de comparaison à une valeur théorique
  • Homogènes dans le cas d’un test de comparaison de population
  • Parfaitement associées dans le cas d’un test de corrélation
  • Conformes à la loi de distribution dans le cas d’un test d’adéquation.

Cette hypothèse est appelée hypothèse nulle, car elle considère qu’il n’y a aucune différence entre les données.

 

Voici les différents tests statistiques à votre disposition. Tous ces tests sont disponibles dans la partie statistique inférentielle d’Ellistat.

Tests de comparaison de population :

Ces tests vous permettent de comparer plusieurs populations contenant des mesures quantitatives entre elles. Par exemple, les lots produits par deux machines différentes, les notes de différentes classes etc…

Exemple 1 : Vous avez réalisé des pièces en utilisant 2 machines de production(rouge et bleu). Vous avez mesuré la résistance à la rupture des pièces produites et avez obtenu le résultat suivant. La machine rouge produit-elle des produits plus résistants que la machine bleue?

Exemple1

Voir l’exemple

Exemple 2 : Vous avez relevé les notes de différentes classes en mathématique. Les notes des différentes classes sont-elles homogènes en moyenne et en variance ?

Exemple 2

Tests de comparaison de fréquence

Les tests de fréquences vous permettent de comparer la proportion d’apparition d’un phénomène entre plusieurs lots. Par exemple la proportion de défaut entre une configuration de production et une autre.

Exemple 3: Vous avez reçu deux lots de deux fournisseurs différents. Les pièces rouges représentent les pièces défectueuses. Le taux de défaut du fournisseur A est donc de 2/24 et le taux de défaut du fournisseur B est de 5/30. Avec les données dont vous disposez, pouvez-vous dire que le fournisseur A est significativement meilleur que le fournisseur B?

Exemple 3

Exemple 4: Vous souhaitez résoudre un problème de bavure sur une machine d’usinage. Vous supectez la profondeur de passe d’être à l’origine de ces bavures. Vous prévoyer de faire 3 essais d’une trentaine de pièce chacun en faisant varier la profondeur de passe. Pour chacun des ces essais vous avez mesuré sur chacune des pièces s’il y a ou non des bavures Voici les résultats de vos essais:

  P = 0,02 P = 0,04 P = 0,06
Sans bavure 25 22 35
Avec bavure 6 2 1
Limite 4 3 0

D’après les résultats de ces essais, y a-t-il une configuration d’usinage qui permet de réduire significativement les bavures?

Tests de comparaison à une valeur théorique :

Les tests de comparaison à une valeur théorique vous permettent de comparer une population à une valeur théorique.

Exemple 5 : Après avoir mesuré la vitesse suivante sur les neutrinos, peut-on dire qu’ils se déplacent en moyenne à une vitesse significativement supérieure à la vitesse de la lumière qui est de 299 000 km/s?

Exemple 5

Exemple 6 : On suppose qu’il y a 50% de femmes dans la population. Dans une entreprise de 952 personnes on dénombre 440 femmes et 512 hommes. Cette différence est-elle significative ?

Tests de corrélation :

Les tests de corrélation vous permettent de vérifier si deux variables quantitatives semblent liées.

Exemple 7: Vous avez mesuré la résistance à la rupture d’un ressort en fonction de la pression à laquelle il a été produit. La pression a-t-elle une influence sur la résistance du ressort ?

Exemple 7

Test de régression linéaire multiple :

Ou analyse de grands tableaux… Cette analyse vous permet de trouver les facteurs influents sur votre Y lorsque vous disposez d’un large tableau de données contenant sur chaque ligne, les Y en fonction des X.

Exemple 8: Vous souhaitez maximiser la réponse A en fonction de différents paramètres que vous avez relevés. Quels sont les facteurs significatifs et comment faire pour maximiser la réponse A :

Exemple 8

 

Voici les différents tests à utiliser en fonction des cas:

Cas étudiés Tests paramétriques

 

(fait l’hypothèse d’une loi de distribution)

Tests non paramétriques

 

(Ne fait pas d’hypothèse de loi)

Comparaison à une valeur théorique
Egalité d’une fréquence à une valeur Test 1 P
Egalité d’une moyenne à une valeur Test z Théorique

 

Test t théorique

Test des runs

 

Test des signes

Comparaison de populations
Comparaison de deux populations appairées Test t appairé Test de Wilcoxon appairé

 

Test des signes

Comparaison de la position de 2 populations Test z

 

Test t

B to C

 

Test Mann Whitney

Comparaison de la position de k populations ANAVAR Test de Krustal-Wallis
Comparaison de deux fréquences Test 2P
Corrélations
Corrélation de 2 variables R²  et coefficient de student Coeft de Spearman

 

Coeft de Kendal t

Corrélation de k variables avec un Y Régression multi linéaire