Gyakran előfordul, hogy amikor meg akarjuk érteni, hogyan működik egy folyamat, akkor egy olyan adattáblával találjuk szembe magunkat, mint az alábbi. Ebben a példában azt szeretnénk látni, hogy mely paraméterek befolyásolják egy úszómedence pH-értékét.
Pastille szállító | Vízhőmérséklet | 2 tabletta közötti idő | pH |
---|---|---|---|
A | 21.8 | 8.0 | 7.5 |
A | 21.9 | 5.0 | 7.4 |
A | 23.4 | 9.0 | 7.4 |
A | 21.7 | 10.0 | 7.2 |
Más szóval, egy több sort tartalmazó táblázat, amelynek minden egyes sora tartalmazza a javítani kívánt mérés (ebben az esetben a pH) és a gyártás/mérés idején fennálló technológiai feltételek (ebben az esetben a tablettaszállító típusa, a víz hőmérséklete és az utolsó tabletta óta eltelt idő) adatait. Az ilyen típusú feladatok nehézsége az, hogy tudjuk, hogyan elemezzük az adatokat, és megtudjuk belőlük, hogyan működik a folyamat.
????Fő fogadásAz ilyen típusú táblázatok készítésekor ne egyesítse a cellákat az Excelben, mivel ez általában megnehezíti az utólagos elemzést.
Az adatok elemzésének 1. lépése: Nézzen egyenesen a táblázat szemébe!
Az első reakciónk az ilyen típusú táblázatokra gyakran az, hogy egyenesen a szemébe nézünk, és megpróbáljuk megérteni az ábrákból, hogyan viselkedik a folyamat. Ezt meghagyom, de nem könnyű, mert az agyunkat nem erre tervezték. Valójában 70% idegsejtünk a vizuális információk elemzésére van tervezve. De egy ábrákból álló táblázat nem sok vizuális információt tartalmaz, különösen nem olyan ábrákat, amelyeket nehéz értelmeznünk. Ha tehát intuíciót akarunk kialakítani, gyorsan tovább kell lépnünk a 2. lépésre.
Az adatok elemzésének 2. lépése: Grafikonok készítése
Az agyunk vizuális, ezért úgy elégítjük ki, hogy grafikákat adunk nekik, amelyeket nézegethetnek.

A fenti grafikon a két szállító, A és B szerinti pH-méréseket mutatja. Rögtön jobban működik, láthatjuk, hogy a tabletta szállítója úgy tűnik, hogy hatással van a medencénk pH-jára... A grafikonok készítése azonban nem lehet az elemzésünk végső fázisa. Bár lehetővé teszi az agyunk számára, hogy intuíciót alakítson ki, nem nyújt bizonyítékot arra, hogy a tablettaszállító valóban hatással van a medence pH-jára. Ehhez a következőkre van szükségünk statisztikai bizonyítékok.
3. lépés az adatok elemzéséhez : Bizonyítás statisztikai tesztekkel
Ha már tudja, hogy mely grafikonok érdekesek, csak annyit kell tennie, hogy megkérdezi, hogy Ellistat a "statisztikai bizonyíték" gombra kattintva statisztikai bizonyítékot szolgáltassanak az általunk elmondottakra. A következő ablak jelenik meg:

Ha elolvassuk, amit Ellistat mond, láthatjuk, hogy az átlagok közötti különbség (ANAVAR és TEST T) statisztikailag "nagyon jelentősen különbözik". Ez a szállító befolyásának bizonyítéka. Ez már nem intuíció, hanem bizonyíték.
Az adatok elemzésének 4. lépése: A folyamat modellezése
Tökéletes, megmutattuk a táblaszállító befolyását. Ez jó, de tudunk ennél tovább menni? Nos, igen, ha megpróbáljuk modellezni a folyamatot. Ahelyett, hogy egyesével elemeznénk az oszlopokat, megpróbálunk egyszerre több oszlopot elemezni többszörös regresszióval. Az eredmény a következő:

A többszörös regresszió segítségével nemcsak azt látjuk, hogy a tabletta szállítójának hatása statisztikailag szignifikáns (lásd a szignifikancia oszlopot), hanem azt is, hogy az utolsó tabletta óta eltelt idő is befolyásoló tényező. És mindez egyetlen tanulmányban - ez szinte varázslatos.
Ha még tovább szeretne menni, egyszerűen lépjen az előrejelzés fülre, és megjósolhatja medencéje pH-értékét a szállító típusa, a két tabletta közötti idő és a vízhőmérséklet alapján:

Tehát az A szállítót és a két tabletta közötti 7,5 napos időt használva 7,4-es átlagos pH-t jósolunk.
Következtetés
Egy adattábla elemzése nem olyan bonyolult, mint amilyennek látszik. Csak a cikk utolsó 3 lépését kell elsajátítania ahhoz, hogy megértse, hogyan működnek a folyamatai. Az Ellistat segít ebben a folyamatban, hogy végigvezesse Önt a vizsgálaton, hogy ne kelljen a statisztikai számításokkal foglalkoznia, hanem a fizikai jelenségek megértésére koncentráljon.