Tests paramétriques vs non paramétriques

Lorsque l’on réalise des comparaisons de population ou que l’on compare une population à une valeur théorique, il existe deux grandes familles de tests : les tests paramétriques, et les tests non paramétriques.

Tests paramétriques

Les tests paramétriques fonctionnent en supposant que les données que l’on a à disposition suivent un type de loi de distribution connu (en général la loi normale).

Pour calculer le risque alpha du test statistique, il suffit de calculer la moyenne et l’écart-type de l’échantillon afin d’accéder à la loi de distribution de l’échantillon.

Test paramétrique

La loi de distribution étant ainsi parfaitement connue, on peut calculer le risque alpha en se basant sur les calculs théoriques de la loi gaussienne.

Ces tests sont en général très fins, mais ils nécessitent que les données suivent effectivement la loi de distribution supposée. Ils sont en particulier très sensibles aux valeurs aberrantes et ne sont pas conseillés si des valeurs aberrantes sont détectées.

Tests non paramétriques

Les tests non paramétriques ne font aucune hypothèse sur le type de loi de distribution des données. Ils se basent uniquement sur les propriétés numériques des échantillons. Voici un exemple de test non paramétrique :

On souhaite vérifier que la médiane d’une population est différente d’une valeur théorique. On mesure 14 pièces et on obtient l’échantillon suivant :

Test non paramétrique

11 fois du même coté sur 14

11 fois sur 14, le résultat est inférieur à la médiane théorique. Si la médiane de la population est égale à la valeur théorique, on devrait avoir 50% des pièces supérieures à la médiane et 50% des pièces inférieures. Pour statuer sur la significativité de l’écart de la médiane à la médiane théorique, il suffit donc de vérifier si la fréquence de 11 fois sur 14 est significativement différente de 50%.

Exemple

On observe que cet écart est limite.

Comme pour l’exemple précédent, les tests non paramétriques n’ont pas besoin de supposer un type de distribution particulière pour calculer le risque alpha du test. Ils sont très élégants et se basent sur des propriétés numériques. De plus, ils sont très peu sensibles aux valeurs aberrantes et sont donc conseillés dans ce cas.