Tests de valeurs aberrantes
Lorsque l’on analyse une série de données, il arrive que l’on se retrouve confronté à des valeurs qui nous semblent ne pas faire partie de la distribution normale des données. On appelle ces points des valeurs aberrantes et comme d’habitude, il ne faut pas toujours se fier à son intuition pour pouvoir détecter si une valeur est aberrante ou non, il existe des tests qui permettent de les mettre en évidence.
D’un point de vue statistique, une valeur aberrante est une valeur qui n’appartient pas à la distribution normale des données. Elle peut provenir :
- D’une erreur de mesure ou de recopie (oubli de la virgule)
- D’une cause spéciale comme une pièce non lavée avant mesure.
L’ensemble des calculs statistiques utilisant les propriétés de la loi normale (tests statistiques, calcul de capabilité, calcul de % hors tolérance) est très sensible à la présence de valeurs aberrantes, il convient donc de comprendre leur origine et de les éliminer avant d’utiliser ces calculs. On pourra éventuellement utiliser les tests statistiques non paramétriques qui sont beaucoup moins sensibles aux valeurs aberrantes.
Deux tests sont principalement utilisés :
- Test de Dixon : très intéressant lorsque le nombre de données est faible (<30)
- Test de Grubb : peut-être utilisé dans tous les cas.