I parametri di posizione statistica sono misure utilizzate in statistica per individuare la posizione centrale o tipica dei dati in un insieme di valori. I principali parametri di posizione statistica includono :
- Media La media è la somma di tutti i valori, divisa per il numero totale di valori. È sensibile agli outlier perché utilizza tutti i dati per il calcolo.
- Mediano La mediana è il valore che divide l'insieme dei dati in due parti uguali quando vengono classificati in ordine crescente. È meno sensibile agli outlier rispetto alla media.
- Modalità Modalità: la modalità è il valore che compare più frequentemente in un insieme di dati. Può esserci una modalità (distribuzione unimodale) o più modalità (distribuzione multimodale).
Questi tre parametri forniscono indicazioni diverse sulla posizione centrale dei dati e vengono utilizzati per comprendere la tendenza centrale di un insieme di valori.
La media :
Conosciuta anche come media aritmetica, è un concetto fondamentale della statistica e della matematica. Rappresenta la posizione della distribuzione nello spazio dei numeri reali. In statistica, la media della popolazione è spesso simboleggiata con la lettera greca (𝜇), mentre la media campionaria è simboleggiata con la lettera X.
Il calcolo esatto della media di una distribuzione di equazioni è dato da :
\mu=\oint_{}^{}xf (x)dx
In realtà, molto raramente conosciamo l'equazione della distribuzione, ma abbiamo una serie di valori Xn. Calcoliamo quindi un'approssimazione X della media 𝜇 calcolando :
X = \sum_{1}^{n}\frac{xi}{n}=\frac{{text{somma dei valori}}{{text{numero totale dei valori}}
- 𝑥𝑖: valore iridato nella serie di valori
- n: numero di valori misurati
Il valore medio rappresenta un valore centrale che viene utilizzato per caratterizzare l'insieme dei dati. È sensibile ai valori estremi, il che significa che un singolo valore molto grande o molto piccolo può influenzare notevolmente la media.
EsempioSi supponga di avere i seguenti numeri: 9, 9, 10, 11 e 11. La media di questo campione X :
X = \frac{testo{somma dei valori}}{testo{numero totale dei valori}} = \frac{9+9+10+11+11}{5}
X = \frac{50}{5} = 10
La mediana :
La mediana è una misura di tendenza centrale utilizzata in statistica. In statistica è spesso simboleggiata dalla lettera 𝜂. A differenza della media, che si calcola sommando tutti i valori di un insieme di dati e dividendo per il numero totale di valori n, la mediana è il valore che si trova al centro dell'insieme di dati ordinati in ordine crescente o decrescente.
Per trovare la mediana di un insieme di dati :
- Ordina i valori del set di dati in ordine crescente o decrescente.
- Se la serie di dati ha un numero dispari di valori, la mediana è il valore esattamente a metà della serie ordinata.
- Se la serie di dati ha un numero pari di valori, la mediana è la media dei due valori al centro della serie ordinata.
Caso di esempio n=oddConsideriamo il seguente insieme di dati: 2, 4, 7, 1, 9, 3, 5.
- Ordinare i valori in ordine crescente: 1, 2, 3, 4, 5, 7, 9.
- Poiché questa serie di dati ha un numero dispari di valori (7 valori), la mediana è il valore che si trova a metà della serie ordinata, cioè il quarto valore, che è 4.
Caso esemplificativo n= coppiaIn un altro esempio con un insieme di dati pari, ad esempio: 2, 4, 6, 8, 10, 12 :
- Ordinare i valori in ordine crescente: 2, 4, 6, 8, 10, 12.
- Poiché questa serie di dati ha un numero pari di valori (6 valori), la mediana è la media dei due valori centrali, cioè (6 + 8) / 2 = 7.
Caratteristiche speciali della mediana:
Quando la distribuzione dei dati non è simmetrica (ad esempio, la distribuzione degli stipendi in Francia), l'uso della media sarà poco utile, poiché è fortemente tirata verso il lato in cui la coda della distribuzione si allunga (se aggiungiamo 10 miliardari in Francia, è probabile che la media aumenti). Se invece prendiamo la mediana, l'impatto sarà minimo o nullo su una popolazione molto ampia (30,1 milioni di lavoratori in Francia).
Utilizzo del modulo Analisi dei dati Ellistat.
Modalità:
In statistica, la modalità è il valore che compare più frequentemente in un insieme di dati. È il valore con la frequenza più alta, cioè il numero di volte in cui si ripete nell'insieme. Un insieme di dati può avere una modalità, più modalità o nessuna modalità.
La modalità è particolarmente utile per i dati categorici, come i colori, i tipi di veicoli o le categorie di prodotti. Tuttavia, può essere applicata anche a dati numerici discreti.
Ad esempio, si consideri il seguente set di dati:
2,3,5,3,7,2,8,3
In questo insieme di dati, il numero 3 compare più frequentemente degli altri numeri, quindi il 3 è la modalità per questo insieme di dati.
È importante notare che, a differenza della media e della mediana, la modalità non fornisce alcuna indicazione sulla dispersione o sulla tendenza generale dei dati, ma si concentra semplicemente sul valore più frequente. Un insieme di dati può avere una singola modalità (unimodale) se c'è un singolo valore che si ripete più frequentemente degli altri, oppure essere bimodale se ci sono due valori che sono entrambi i più frequenti. (Questo è il caso in cui si mescolano due popolazioni diverse: due fornitori diversi, per esempio).
Utilizzo del modulo Analisi dei dati Ellistat.