Standradavvikelse

Vad är skillnaden mellan de två olika formelerna?

$σ = \sqrt{\frac{\sum {(x - m)}^{2}}{n}} o c h σ = \sqrt{\frac{\sum {(x - m)}^{2}}{n - 1}}$

jag vet att den första är vid standradavvikelsen och den andra är vid typ stickprov men jag försår inte direkt grejen

Det korta svaret till varför vi väljer att dividerar med n-1 vid stickprov är för att vi vill få fram en unbiased estimator.

Detta kommer från konceptet kring frihetsgrader.

Exempel:

Du har fyra datapunkter x1 = 4, x2 = 3, x3 = 2, och x4 = 5, alla dessa tal kan röra sig fritt de kan anta vilket värde som helst.

Låt oss nu säga att du vill beräkna medelvärdet = $\frac{1}{n} \sum_{i = 1}^{n} X_{i}$

Notera att medelvärdet x n, är lika med summan av alla värdena

I vårt fall har vi

medelvärde= 3.5

n = 4

$\sum_{}^{} X_{i}$ = 14

Där 3.5 x 4 = 14

Om vi nu vet att vårt medelvärde ska vara 3.5 och att summan av alla värden ska vara 14. Så är våra 3 första värden fria att variera vi skulle exempelvis kunna ta värdena x1 = 2, x2= 5 och x3= 1 MEN det fjärde värdet kommer inte kunna variera om vi vill ha ett medelvärde på 3.5 och en summa på 14, utan det MÅSTE ta värdet x4 = 6.

Därför säger vi att vi har 4-1 frihetsgrader då 3 av värdena kan anta vilket värde som helst, n-1.

Vid beräkningar av standardavvikelsen vid ett stickprov dividera vi alltså med n-1 för att få en bättre gissning av den sanna variansen i populationen och inte underskatta dess värde. Tänk på att när nämnaren i ett bråk minskar så ökar kvoten.

Svara