Statistische Parameter der Position

Lesezeit

Statistische Positionsparameter sind Messungen, die in der Statistik verwendet werden, um die zentrale oder typische Position von Daten in einem Satz von Werten zu lokalisieren oder zu verorten. Zu den wichtigsten statistischen Positionsparametern gehören : 

  • Durchschnitt : Der Mittelwert ist die Summe aller Werte, geteilt durch die Gesamtzahl der Werte. Er ist anfällig für Ausreißer, da er alle Daten zu seiner Berechnung verwendet. 
  • Median : Der Median ist der Wert, der den Datensatz in zwei gleiche Teile teilt, wenn er in aufsteigender Reihenfolge geordnet wird. Er ist weniger anfällig für Ausreißer als der Mittelwert. 
  • Modus : Der Modus ist der Wert, der in einem Datensatz am häufigsten vorkommt. Es kann einen Modus (unimodale Verteilung) oder mehrere Modi (multimodale Verteilung) geben. 

Diese drei Parameter geben unterschiedliche Hinweise auf die zentrale Position der Daten und werden verwendet, um die zentrale Tendenz eines Satzes von Werten zu verstehen. 

Durchschnitt : 

Auch arithmetisches Mittel genannt, ist ein grundlegendes Konzept in der Statistik und Mathematik. Er stellt die Position der Verteilung im Raum der reellen Zahlen dar. In der Statistik wird der Mittelwert der Bevölkerung oft durch den griechischen Buchstaben (𝜇) symbolisiert, während der Mittelwert einer Stichprobe durch den Buchstaben X gekennzeichnet ist.

Die genaue Berechnung des Mittelwerts einer Gleichungsverteilung ist gegeben durch : 

\\\\\X f (x)dx

In der Realität kennt man die Gleichung der Verteilung nur selten, sondern hat eine Reihe von Werten Xn zur Verfügung. Wir berechnen daher eine X-Näherung des Mittelwerts 𝜇, indem wir : 

X = sum_{1}^{n}\Frac{xi}{n}=\Frac{text{Summe der Werte}{text{Gesamtzahl der Werte}}

  • 𝑥𝑖: i-ter Wert in der Wertereihe 
  • n: Anzahl der Messwerte 

Der Mittelwert stellt einen zentralen Wert dar, der zur Charakterisierung des Datensatzes verwendet wird. Er ist empfindlich gegenüber Extremwerten, d. h. ein einziger sehr großer oder sehr kleiner Wert kann den Mittelwert erheblich beeinflussen. 

Beispiel: Angenommen, Sie haben die folgenden Zahlen: 9, 9, 10, 11 und 11. Der Mittelwert dieser Stichprobe X :

X =\frac{\text{somme des valeurs}}{\text{nombre total des valeurs}} = \frac{9+9+10+11+11}{5}

X = frac{50}{5} = 10

Median : 

Der Median ist ein Maß für die zentrale Tendenz, das in der Statistik verwendet wird. In der Statistik wird er häufig durch den Buchstaben 𝜂 symbolisiert. Im Gegensatz zum Mittelwert, der berechnet wird, indem alle Werte eines Datensatzes addiert und durch die Gesamtzahl der Werte n dividiert werden, ist der Median der Wert in der Mitte des Datensatzes, wenn er in aufsteigender oder absteigender Reihenfolge sortiert wird. 

Um den Median eines Datensatzes zu finden : 

  1. Sortieren Sie die Werte des Datensatzes in aufsteigender oder absteigender Reihenfolge. 
  2. Wenn der Datensatz eine ungerade Anzahl von Werten hat, ist der Median der Wert, der genau in der Mitte der sortierten Reihe liegt. 
  3. Wenn der Datensatz eine gerade Anzahl von Werten hat, ist der Median der Mittelwert der beiden Werte in der Mitte der sortierten Reihe.  

Beispiel Fall n=ungerade: Betrachten wir den folgenden Datensatz: 2, 4, 7, 1, 9, 3, 5. 

  1. Sortieren Sie die Werte in aufsteigender Reihenfolge: 1, 2, 3, 4, 5, 7, 9. 
  2. Da dieser Datensatz eine ungerade Anzahl von Werten hat (7 Werte), ist der Median der Wert in der Mitte der sortierten Reihe, d. h. der vierte Wert, der 4 beträgt. 

Beispiel Fall n= Paar: In einem anderen Beispiel mit einem geraden Datensatz, z. B.: 2, 4, 6, 8, 10, 12 : 

  1. Sortiere die Werte in aufsteigender Reihenfolge: 2, 4, 6, 8, 10, 12. 
  2. Da dieser Datensatz eine gerade Anzahl von Werten hat (6 Werte), ist der Median der Mittelwert der beiden mittleren Werte, d. h. (6 + 8) / 2 = 7. 

Besonderheit des Medians

Wenn die Verteilung der Daten nicht symmetrisch ist (z. B. die Lohnverteilung in Frankreich), ist die Verwendung des Mittelwerts wenig sinnvoll, da dieser stark in die Richtung gezogen wird, in der sich das Ende der Verteilung verlängert (wenn man 10 Milliardäre in Frankreich hinzufügt, kann der Mittelwert steigen). Wenn man jedoch den Median nimmt, wird dieser bei einer sehr großen Bevölkerung (30,1 Millionen Erwerbstätige in Frankreich) kaum oder gar nicht beeinflusst. 

Verwendung des Moduls Data Analysis von Ellistat.

Modus : 

In der Statistik ist der Modus der Wert, der in einem Datensatz am häufigsten vorkommt. Es ist der Wert, der die höchste Frequenz hat, d. h. wie oft er im Datensatz vorkommt. Ein Datensatz kann einen Modus, mehrere Modi oder gar keinen Modus aufweisen. 

Der Modus ist besonders nützlich für kategoriale Daten, z. B. Farben, Fahrzeugtypen oder Produktkategorien. Er kann jedoch auch auf diskrete numerische Daten angewendet werden. 

Betrachten wir zum Beispiel den folgenden Datensatz : 

2,3,5,3,7,2,8,3 

In diesem Datensatz kommt die Zahl 3 häufiger vor als die anderen Zahlen, daher ist 3 der Modus dieses Datensatzes. 

Es ist wichtig zu beachten, dass der Modus im Gegensatz zu Mittelwert und Median keinen Hinweis auf die Streuung oder den allgemeinen Trend der Daten liefert, sondern sich lediglich auf den am häufigsten vorkommenden Wert konzentriert. Ein Datensatz kann einen einzelnen Modus (unimodal) haben, wenn es nur einen Wert gibt, der sich häufiger als die anderen wiederholt, oder er kann bimodal sein, wenn es zwei Werte gibt, die beide am häufigsten vorkommen. (Dies ist der Fall, wenn zwei verschiedene Populationen gemischt werden: z. B. zwei verschiedene Anbieter). 

Verwendung des Moduls Data Analysis von Ellistat.