Deviazione vs deviazione standard
Deviazione vs deviazione standard
Nelle statistiche descrittive e inferenziali, vengono utilizzati diversi indici per descrivere un set di dati corrispondente alla sua tendenza centrale, dispersione e asimmetria. Nell'inferenza statistica, questi sono comunemente noti come stimatori poiché stimano i valori dei parametri della popolazione.
La dispersione è la misura della diffusione dei dati intorno al centro del set di dati. La deviazione standard è una delle misure di dispersione più comunemente utilizzate. Le deviazioni di ciascun punto dati dalla media vengono prese in considerazione nel calcolo della deviazione standard. Quindi, si può sostenere che la deviazione standard insieme alla media fornirà un'immagine quasi sufficiente di un set di dati.
Considera il seguente set di dati. Il peso di 10 persone (in chilogrammi) è misurato come 70, 62, 65, 72, 80, 70, 63, 72, 77 e 79. Quindi il peso medio delle dieci persone (in chilogrammi) è 71 (in chilogrammi).
Cos'è la deviazione?
Nelle statistiche, per deviazione si intende la quantità di cui un singolo punto dati differisce da un valore fisso come la media. In generale, sia k un valore fisso e x 1, x 2,…, x n denotano un insieme di dati. Quindi, la deviazione di x j da k è definita come (x j - k).
Ad esempio, nel set di dati di cui sopra le rispettive deviazioni dalla media sono (70-71) = -1, (62-71) = -9, (65-71) = -6, (72-71) = 1, (80-71) = 9, (70-71) = -1, (63-71) = -8, (72-71) = 1, (77-71) = 6 e (79-71) = 8.
Cos'è la deviazione standard?
Quando si possono prendere in considerazione i dati dell'intera popolazione (ad esempio nel caso di un censimento), è possibile calcolare la deviazione standard della popolazione. Per calcolare la deviazione standard della popolazione, vengono prima calcolate le deviazioni dei valori dei dati dalla media della popolazione. La radice quadrata media (media quadratica) delle deviazioni è chiamata deviazione standard della popolazione. Nei simboli, σ = √ {∑ (x i -µ) 2 / n} dove µ è la media della popolazione e n è la dimensione della popolazione.
Quando i dati di un campione (di dimensione n) vengono utilizzati per stimare i parametri della popolazione, viene calcolata la deviazione standard del campione. Per prima cosa vengono calcolate le deviazioni dei valori dei dati dalla media campionaria. Poiché la media campionaria viene utilizzata al posto della media della popolazione (che è sconosciuta), non è appropriato prendere la media quadratica. Per compensare l'uso della media campionaria, la somma dei quadrati delle deviazioni viene divisa per (n-1) invece di n. La deviazione standard del campione è la radice quadrata di questo. Nei simboli matematici, S = √ {∑ (x i -ẍ) 2 / (n-1)}, dove S è la deviazione standard campionaria, ẍ è la media campionaria e xi sono i punti dati.
Nel precedente set di dati, la somma dei quadrati di deviazione è (-1) 2 + (-9) 2 + (-6) 2 + 1 2 + 9 2 + (-1) 2 + (-8) 2 + 1 2 + 6 2 + 8 2 = 366. Pertanto, la deviazione standard della popolazione è √ (366/10) = 6,05 (in chilogrammi). (Supponendo che la popolazione in esame sia composta dalle 10 persone da cui sono stati presi i dati).
Qual è la differenza tra deviazione e deviazione standard? • La deviazione standard è un indice statistico e uno stimatore, ma la deviazione non lo è. • La deviazione standard è una misura della dispersione di un cluster di dati dal centro, mentre la deviazione si riferisce alla quantità di cui un singolo punto di dati differisce da un valore fisso. |