Vergleichen von Verteilungen: Cramér-von Mises-Test und Energie-Test

Lesezeit
Startseite / Blog / Datenanalyse / Vergleichen von Verteilungen: Cramér-von Mises-Test und Energie-Test
Unsere Lösungen ansehen

Vergleichen von Verteilungen statt Mittelwerten: ein entscheidender Fortschritt für die Qualitätskontrolle durch den Cramée-von-Mises-Test und den Energie-Test

Zwei Sätze von Münzen. Gleicher Mittelwert. Gleiche scheinbare Standardabweichung.

Die Mittelwerte und Varianzen sind hier im Wesentlichen gleich, und doch kann man intuitiv einen Unterschied zwischen diesen beiden Maschinen spüren.

Herkömmliche Hypothesentests zeigen jedoch keinen Unterschied zwischen den beiden Verteilungen.

Aber Mittelwert und Varianz erzählen nur einen Teil der Geschichte eines Bearbeitungsprozesses. Um echte Unterschiede zwischen Messgruppen, zwischen zwei Lieferanten, zwei Maschinen, zwei Schichten, zwei Produktionszeiträumen...zu erkennen, müssen die vollständigen Verteilungen verglichen werden. Genau das ermöglichen zwei statistische Tests, die in Ellistat Data Analysis : der Test von Cramér-von Mises und der Test Energie.

Der Cramér-von Mises-Test

Mit diesem Test können Sie vergleichen :

  • entweder eine Stichprobe mit einer theoretischen Verteilung
  • entweder zwei Proben untereinander

Das Prinzip : der Test vergleicht die kumulierten Verteilungsfunktionen (Ogives) der beiden Verteilungen.

Mit anderen Worten: Er misst, «wie weit die kumulierten Kurven voneinander entfernt sind»?

Wenn die beiden Verteilungen nahe beieinander liegen, überlagern sich die Sprengköpfe. Wenn sie sich unterscheiden, steigt die kumulierte Abweichung.

Der Energietest

Dieser Test verallgemeinert diesen Ansatz auf mehrere Gruppen. Er eignet sich besonders, wenn :

  • man mehr als zwei Populationen vergleicht
  • die Verteilungen sind unbekannt
  • die Daten sind multidimensional

Das Prinzip : Der Test beruht auf einer intuitiven Idee: Vergleichen Sie die Entfernungen zwischen Punkten.

Er misst :

  • die durchschnittlichen Entfernungen innerhalb der Gruppen
  • dann die Abstände zwischen den Gruppen

Wenn die Gruppen aus der gleichen Verteilung stammen, sind die Abstände innerhalb und zwischen den Gruppen ähnlich. Andernfalls werden die Abstände zwischen den Gruppen größer.

Was sich in der Praxis ändert

Zwei Anbieter auf einem kritischen Durchmesser vergleichen. Eine Änderung der Maschineneinstellung validieren. Eine Vorher-Nachher-Analyse zu einem instabilen Prozess durchführen. Zwei Bearbeitungszentren unterscheiden, die dieselben Teile herstellen - scheinbar.

In all diesen Fällen kann es irreführend sein, nur den Mittelwert und die Varianz zu betrachten.

Der Vergleich von Vollverteilungen vermittelt ein wahrheitsgetreues Bild dessen, was tatsächlich passiert.

Im Ellistat-Modul Data Analysis werden diese Tests mit Visualisierungen gekoppelt: Fischgräten, KDE, überlagerte Histogramme, denn ein p-Wert ohne visuellen Kontext überzeugt niemanden in der Werkstatt.

Das Ziel ist nicht, ein statistisches Ergebnis zu produzieren, sondern zu verstehen, warum sich zwei Prozesse unterschiedlich verhalten, und zu handeln.