Statisztikai helyzetparaméterek

Olvasási idő

A statisztikai helyzetparaméterek a statisztikában az adatok központi vagy tipikus helyének meghatározására vagy meghatározására használt mértékek egy értékkészletben. A főbb statisztikai helyzetparaméterek a következők: 

  • Átlagos Az átlag az összes érték összege, osztva az értékek teljes számával. Érzékeny a kiugró értékekre, mivel az összes adatot felhasználja a számításhoz. 
  • Medián A medián az az érték, amely az adathalmazt két egyenlő részre osztja, ha az adatokat növekvő sorrendben rangsoroljuk. Kevésbé érzékeny a kiugró értékekre, mint az átlag. 
  • Mód Mód: A mód az az érték, amely a leggyakrabban fordul elő egy adathalmazban. Lehet egy módusz (unimodális eloszlás) vagy több módusz (multimodális eloszlás). 

Ez a három paraméter különböző módon jelzi az adatok központi helyzetét, és arra szolgál, hogy megértsük egy értékkészlet központi tendenciáját. 

Az átlagos : 

A számtani középérték néven is ismert fogalom a statisztika és a matematika egyik alapfogalma. Az eloszlás helyét jelöli a valós számok terében. A statisztikában a populációs átlagot gyakran görög betűvel (𝜇), míg a mintaátlagot X betűvel szimbolizálják.

Egy egyenleteloszlás átlagának pontos kiszámítása a következő módon lehetséges: 

\mu=\oint_{}^{}xf (x)dx

A valóságban nagyon ritkán ismerjük az eloszlás egyenletét, de rendelkezünk egy sor Xn értékkel. Ezért kiszámítjuk az 𝜇 átlag X közelítését azáltal, hogy kiszámítjuk : 

X = \sum_{1}^{n}\frac{xi}{n}=\frac{\text{értékek összege}}{\text{értékek száma összesen}}

  • 𝑥𝑖: az értékek sorozatának i-edik értéke. 
  • n: a mért értékek száma 

Az átlagérték egy központi értéket jelent, amely az adathalmaz jellemzésére szolgál. Érzékeny a szélsőértékekre, ami azt jelenti, hogy egyetlen nagyon nagy vagy nagyon kicsi érték is jelentősen befolyásolhatja az átlagot. 

PéldaTegyük fel, hogy a következő számok vannak: 9, 9, 10, 11 és 11. Ennek a mintának az átlaga X :

X = \frac{text{értékek összege}}{text{értékek száma}} = \frac{9+9+10+11+11+11}{5}{5}

X = \frac{50}{5} = 10

A medián : 

A medián a statisztikában használt központi tendencia mérőszáma. A statisztikában gyakran 𝜂 betűvel jelölik. Az átlaggal ellentétben, amelyet úgy számítunk ki, hogy az adathalmazban lévő összes értéket összeadjuk, és elosztjuk az n értékek teljes számával, a medián az adathalmaz közepén lévő érték, ha növekvő vagy csökkenő sorrendbe rendezzük. 

Egy adathalmaz mediánjának meghatározása : 

  1. Az adathalmazban lévő értékek növekvő vagy csökkenő sorrendbe rendezése. 
  2. Ha az adathalmaz páratlan számú értéket tartalmaz, a medián az az érték, amelyik pontosan a sorba rendezett sor közepén helyezkedik el. 
  3. Ha az adatsor páros számú értéket tartalmaz, a medián a rendezett sorozatok közepén lévő két érték átlaga.  

Példa eset n=oddTekintsük a következő adathalmazt: 2, 4, 7, 1, 9, 3, 5. 

  1. Rendezze az értékeket növekvő sorrendbe: 1, 2, 3, 4, 5, 7, 9. 
  2. Mivel ez az adatsor páratlan számú értéket tartalmaz (7 érték), a medián a rendezett sorozat közepén lévő érték, azaz a negyedik érték, azaz a 4-es érték. 

Példa eset n= párEgy másik példában páros adathalmazzal, például: 2, 4, 6, 8, 10, 12 : 

  1. Rendezze az értékeket növekvő sorrendbe: 2, 4, 6, 8, 10, 12. 
  2. Mivel ez az adathalmaz páros számú értéket tartalmaz (6 érték), a medián a két középső érték átlaga, azaz (6 + 8) / 2 = 7. 

A medián különleges jellemzői

Ha az adatok eloszlása nem szimmetrikus (például a franciaországi fizetések eloszlása), akkor az átlag használata kevéssé hasznos, mivel az erősen húzódik arra az oldalra, ahol az eloszlás farka hosszabb lesz (ha Franciaországban 10 milliárdost adunk hozzá, akkor az átlag valószínűleg megnő). Ha viszont a mediánt vesszük, akkor annak alig vagy egyáltalán nem lesz hatása egy nagyon nagy népességre (30,1 millió dolgozó ember Franciaországban). 

A modul használata Ellistat adatelemzés.

Mód: 

A statisztikában a módusz az az érték, amely a leggyakrabban fordul elő egy adathalmazban. Ez az az érték, amely a legnagyobb gyakorisággal fordul elő, azaz ahányszor ismétlődik a halmazban. Egy adathalmaznak lehet egy módusza, több módusza vagy egyáltalán nem lehet módusza. 

Az üzemmód különösen hasznos kategorikus adatok, például színek, járműtípusok vagy termékkategóriák esetében. Azonban diszkrét numerikus adatokra is alkalmazható. 

Vegyük például a következő adathalmazt: 

2,3,5,3,7,2,8,3 

Ebben az adatsorban a 3-as szám gyakrabban fordul elő, mint a többi szám, tehát a 3 a módusz ebben az adatsorban. 

Fontos megjegyezni, hogy az átlagtól és a mediántól eltérően a módusz nem ad semmilyen jelzést az adatok szórására vagy általános tendenciájára vonatkozóan, egyszerűen a leggyakoribb értékre összpontosít. Egy adathalmaznak lehet egyetlen módusza (unimodális), ha van egyetlen olyan érték, amely gyakrabban ismétlődik, mint a többi, vagy lehet bimodális, ha van két olyan érték, amely mindkettő a leggyakoribb. (Ez az eset áll fenn, ha két különböző populáció keveredik: például két különböző beszállító). 

A modul használata Ellistat adatelemzés.