Startseite / Blog / Datenanalyse / Wie analysiert man eine Datentabelle?

Wie analysiert man eine Datentabelle?

Lesezeit
Illustration einer Tabelle mit zu analysierenden Daten

Häufig stößt man, wenn man die Funktionsweise eines Prozesses verstehen möchte, auf eine Datentabelle wie die unten stehende. In diesem Beispiel möchte man sehen, welche Parameter den pH-Wert in einem Schwimmbecken beeinflussen.

Lieferant PastilleWassertemperaturZeit zwischen 2 PelletspH-Wert
A21.88.07.5
A21.95.07.4
A23.49.07.4
A21.710.07.2

Das heißt, eine Tabelle mit mehreren Zeilen, wobei jede Zeile die Informationen über die Messung, die wir verbessern wollen (hier den pH-Wert), und die Prozessbedingungen zum Zeitpunkt der Herstellung/Messung (hier die Art des Tablettenlieferanten, die Wassertemperatur und die Zeit seit der letzten Tablette) enthält. Die Schwierigkeit bei dieser Art von Übung besteht darin, herauszufinden, wie man die Daten analysiert und anhand dieser Daten herausfindet, wie der Prozess funktioniert.

????Tipp: Beim Erstellen dieser Art von Tabelle sollten Sie in Excel keine Kästchen zusammenführen, da dies die nachträgliche Analyse in der Regel erschwert.

Schritt 1, um seine Daten zu analysieren: Man schaut der Tabelle direkt in die Augen

Unsere erste Reaktion auf ein solches Bild ist oft, ihm direkt in die Augen zu schauen und zu versuchen, anhand der Zahlen zu verstehen, wie sich der Prozess verhält. Das überlasse ich Ihnen, aber es ist nicht einfach, denn unser Gehirn ist dafür nicht geschaffen. Tatsächlich sind 70% unserer Nervenzellen dafür gemacht, visuelle Informationen zu analysieren. Eine Zahlentabelle enthält jedoch nicht viele visuelle Informationen, vor allem Zahlen, die wir nur schwer interpretieren können. Wenn wir uns also eine Intuition bilden wollen, müssen wir schnell zu Schritt 2 übergehen.

Schritt 2, um seine Daten zu analysieren: Man erstellt Diagramme

Da unser Gehirn visuell funktioniert, befriedigen wir es, indem wir ihm Grafiken zum Anschauen geben.

Die obige Grafik zeigt die pH-Messungen in Bezug auf die beiden Anbieter A und B. Sofort funktioniert es besser, wir sehen, dass der Lieferant der Tabletten einen Einfluss auf den pH-Wert unseres Pools zu haben scheint... Dennoch sollte das Erstellen von Diagrammen keinesfalls der letzte Schritt in unserer Analyse sein. Denn sie ermöglicht es unserem Gehirn zwar, eine Intuition zu entwickeln, aber sie liefert keinen Beweis dafür, dass der Tablettenlieferant tatsächlich einen Einfluss auf den pH-Wert unseres Pools hat. Dazu brauchen wir ein statistischer Beweis.

Schritt 3, um seine Daten zu analysieren : Der Beweis durch statistische Tests

Wenn man weiß, welche Grafiken interessant sind, kann man einfach fragen Ellistat uns einen statistischen Beweis für unsere Behauptungen zu liefern, indem Sie auf die Schaltfläche "Statistischer Beweis" klicken. Wir erhalten dann das folgende Fenster:

Wenn man genau liest, was Ellistat uns sagt, sieht man, dass die Differenz der Mittelwerte (ANAVAR-Test und TEST T) statistisch "sehr signifikant unterschiedlich" ist. Dies liefert den Beweis für den Einfluss des Anbieters. Es handelt sich nicht mehr um eine Vermutung, sondern um einen Beweis.

Schritt 4 zur Analyse seiner Daten: Den Prozess modellieren

Perfekt, wir haben den Einfluss des Pellet-Anbieters gezeigt. Das ist gut, aber können wir noch einen Schritt weiter gehen? Ja, indem wir versuchen, den Prozess zu modellieren. Anstatt die Spalten eine nach der anderen zu analysieren, versuchen wir, mithilfe einer multiplen Regression mehrere Spalten gleichzeitig zu analysieren. Das Ergebnis ist wie folgt:

Mithilfe der multiplen Regression sehen wir nicht nur, dass der Einfluss des Tablettenlieferanten statistisch signifikant ist (Lesen Sie die Spalte Signif), sondern wir sehen auch, dass die Zeit seit der letzten Tablette ebenfalls einen Einfluss hat. Und das alles in einer einzigen Studie, das ist fast schon magisch.

Wenn Sie noch einen Schritt weiter gehen möchten, gehen Sie einfach auf die Registerkarte Vorhersage und Sie können den pH-Wert des Pools anhand der Art des Lieferanten, der Zeit zwischen zwei Tabletten und der Wassertemperatur vorhersagen:

So sehen wir, dass bei Verwendung von Lieferant A und einer Zeit zwischen zwei Pellets von 7,5 Tagen ein durchschnittlicher pH-Wert von 7,4 vorhergesagt wird.

Schlussfolgerung

Eine Datentabelle zu analysieren ist gar nicht so kompliziert. Sie müssen nur die letzten drei Schritte in diesem Artikel gut beherrschen, um zu verstehen, wie Ihre Prozesse funktionieren. Um Ihnen bei diesem Prozess zu helfen, führt Sie Ellistat durch die gesamte Studie, damit Sie sich nicht um statistische Berechnungen kümmern müssen, sondern sich vor allem auf das physikalische Verständnis der Phänomene konzentrieren können.