Tests auf Ausreißer

Lesezeit

Startseite / Blog / Datenanalyse / Tests auf Ausreißer

Bei der Analyse einer Datenreihe kann es vorkommen, dass man auf Werte stößt, die einem nicht in die Normalverteilung der Daten zu passen scheinen. Diese Punkte nennt man Ausreißer und wie üblich sollte man sich nicht immer auf seine Intuition verlassen, um erkennen zu können, ob ein Wert ein Ausreißer ist oder nicht, es gibt Tests, mit denen man sie aufdecken kann und Statistiksoftware wie Ellistat um Ihnen bei den Berechnungen zu helfen.

Aus statistischer Sicht ist ein Ausreißer ein Wert, der nicht zur Normalverteilung der Daten gehört. Er kann entstehen durch

Ein Mess- oder Kopierfehler (Komma vergessen)
Von einer besonderen Ursache wie einem Stück, das vor dem Messen nicht gewaschen wurde.

Alle statistischen Berechnungen, die die Eigenschaften der Normalverteilung nutzen (statistische Tests, Fähigkeitsberechnung, Berechnung von % außerhalb der Toleranz), sind sehr anfällig für Ausreißer. Daher sollten Sie deren Ursprung verstehen und sie eliminieren, bevor Sie diese Berechnungen anwenden. Eventuell können auch nichtparametrische statistische Tests verwendet werden, die weit weniger anfällig für Ausreißer sind.

Es werden hauptsächlich zwei Tests verwendet:

Test von Dixon : sehr interessant, wenn die Anzahl der Daten gering ist (<30)
Grubbs Test : Kann in jedem Fall verwendet werden.

Test von Dixon

Um den Dixon-Test zu verwenden, berechnen wir das Verhältnis :

b = Der Gesamtumfang der Maßnahmen (hier 14.1)
a = Der Abstand zwischen der Münze, von der vermutet wird, dass sie ein Ausreißer ist, und ihrem nächsten Nachbarn (hier 8.6)

Das Verhältnis wird in % berechnet.

Anschließend vergleicht man diesen Bericht mit der Tabelle von Dixon :


Anzahl der Werkstücke	3	5	10	16	20	30
Maximales Verhältnis	0.94	0.72	0.46	0.38	0.34	0.30

Wenn der Wert unter dem maximalen Verhältnis liegt, das die Tabelle vorschlägt, dann ist der Wert nicht abwegig. Hier ist das Verhältnis von 62% für 5 Münzen kleiner als 72%. Der Punkt ist also kein Ausreißer.

Grubb's Test

Um den Grubb-Test zu verwenden, berechnet man in einem ersten Schritt :

X: Der Durchschnitt aller Messungen
S: Die Standardabweichung aller Messungen
G: Abstand zwischen dem Wert, von dem vermutet wird, dass er ein Ausreißer ist, und dem Mittelwert G.

$G=frac{Wert - X}{S}$

Anschließend vergleicht man den erhaltenen Wert von G mit einem Grenz-G :

$G_{limite}=\frac{N-1}{\sqrt{N}}.\sqrt{\frac{t^2_{\frac{a}{N},N-2}{}}{N-2 +t^2{}_{\frac{a}{n}}{,} N-2}}$

Wenn G>G Grenze wird der Wert als Ausreißer betrachtet und umgekehrt.

Dies sind die Module, mit denen Sie statistische Tests durchführen können:

Qualitätssoftware - Data Analysis Modul für die statistische Verarbeitung all Ihrer Produktionsdaten

Datenanalyse

Statistiken mit 1 Klick. Nutzen Sie die Macht der Statistik, um herauszufinden, was sich hinter Ihren Produktionsdaten aus den Modulen SPC, APC oder IQC verbirgt. Dank seiner Machine-Learning-Algorithmen ermöglicht es das Modul Data Analysis, den Ursprung von Maschinendrifts zu verstehen oder Lieferanten statistisch zu differenzieren.