Popolazione vs deviazione standard del campione
In statistica, vengono utilizzati diversi indici per descrivere un set di dati corrispondente alla sua tendenza centrale, dispersione e asimmetria. La deviazione standard è una delle misure più comuni di dispersione dei dati dal centro del set di dati.
A causa di difficoltà pratiche, non sarà possibile utilizzare i dati dell'intera popolazione quando viene verificata un'ipotesi. Pertanto, utilizziamo i valori dei dati dei campioni per fare inferenze sulla popolazione. In una tale situazione, questi sono chiamati stimatori poiché stimano i valori dei parametri della popolazione.
È estremamente importante utilizzare stimatori imparziali nell'inferenza. Uno stimatore si dice non corretto se il valore atteso di tale stimatore è uguale al parametro della popolazione. Ad esempio, utilizziamo la media campionaria come stimatore imparziale per la media della popolazione. (Matematicamente, si può dimostrare che il valore atteso della media campionaria è uguale alla media della popolazione). Nel caso della stima della deviazione standard della popolazione, anche la deviazione standard campionaria è uno stimatore imparziale.
Cos'è la deviazione standard della popolazione?
Quando i dati dell'intera popolazione possono essere presi in considerazione (ad esempio nel caso di un censimento) è possibile calcolare la deviazione standard della popolazione. Per calcolare la deviazione standard della popolazione, vengono prima calcolate le deviazioni dei valori dei dati dalla media della popolazione. La radice quadrata media (media quadratica) delle deviazioni è chiamata deviazione standard della popolazione.
In una classe di 10 studenti, i dati sugli studenti possono essere facilmente raccolti. Se un'ipotesi viene verificata su questa popolazione di studenti, non è necessario utilizzare valori campione. Ad esempio, i pesi dei 10 studenti (in chilogrammi) sono misurati in 70, 62, 65, 72, 80, 70, 63, 72, 77 e 79. Quindi il peso medio delle dieci persone (in chilogrammi) è (70 + 62 + 65 + 72 + 80 + 70 + 63 + 72 + 77 + 79) / 10, ovvero 71 (in chilogrammi). Questa è la media della popolazione.
Ora per calcolare la deviazione standard della popolazione, calcoliamo le deviazioni dalla media. Le rispettive deviazioni dalla media sono (70-71) = -1, (62-71) = -9, (65-71) = -6, (72-71) = 1, (80-71) = 9, (70 - 71) = -1, (63 - 71) = -8, (72 - 71) = 1, (77 - 71) = 6 e (79 - 71) = 8. La somma dei quadrati della deviazione è (-1) 2 + (-9) 2 + (-6) 2 + 1 2 + 9 2 + (-1) 2 + (-8) 2 + 1 2 + 6 2 + 8 2 = 366. La deviazione standard della popolazione è √ (366/10) = 6,05 (in chilogrammi). 71 è il peso medio esatto degli studenti della classe e 6,05 è la deviazione standard esatta del peso da 71.
Cos'è la deviazione standard del campione?
Quando i dati di un campione (di dimensione n) vengono utilizzati per stimare i parametri della popolazione, viene calcolata la deviazione standard del campione. Per prima cosa vengono calcolate le deviazioni dei valori dei dati dalla media campionaria. Poiché la media campionaria viene utilizzata al posto della media della popolazione (che è sconosciuta), non è appropriato prendere la media quadratica. Per compensare l'uso della media campionaria, la somma dei quadrati delle deviazioni viene divisa per (n-1) invece di n. La deviazione standard del campione è la radice quadrata di questo. Nei simboli matematici, S = √ {∑ (x i -ẍ) 2 / (n-1)}, dove S è la deviazione standard campionaria, ẍ è la media campionaria e x i sono i punti dati.
Supponiamo ora che, nell'esempio precedente, la popolazione sia composta dagli studenti dell'intera scuola. Quindi, la classe sarà solo un campione. Se questo campione viene utilizzato nella stima, la deviazione standard del campione sarà √ (366/9) = 6,38 (in chilogrammi) poiché 366 è stato diviso per 9 invece di 10 (la dimensione del campione). Il fatto da osservare è che non è garantito che questo sia il valore esatto della deviazione standard della popolazione. È solo una stima.
Qual è la differenza tra la deviazione standard della popolazione e la deviazione standard del campione? • La deviazione standard della popolazione è il valore esatto del parametro utilizzato per misurare la dispersione dal centro, mentre la deviazione standard del campione è uno stimatore imparziale per essa. • La deviazione standard della popolazione viene calcolata quando tutti i dati relativi a ciascun individuo della popolazione sono noti. Altrimenti, viene calcolata la deviazione standard del campione. • La deviazione standard della popolazione è data da σ = √ {∑ (xi-µ) 2 / n} dove µ è la media della popolazione en è la dimensione della popolazione ma la deviazione standard del campione è data da S = √ {∑ (xi-ẍ) 2 / (n-1)} dove ẍ è la media campionaria en è la dimensione del campione. |