5 svar
83 visningar
Zebrakadabra 6 – Fd. Medlem
Postad: 16 dec 2020 21:16

Skatta en frekvens på olika sätt

Hej, jag har följande fråga:

 

Låt oss säga att antalet cykelolyckor per antalet cyklar i en viss stadsdel de senaste fem åren har sett ut som följande (en inte helt rimlig frågeställning kanske, men det är egentligen oväsentligt):

År 2015 -> 50 cyklar orsakade 5 olyckor

År 2016 -> 100 cyklar orsakade 5 olyckor

År 2017 -> 200 cyklar orsakade 10 olyckor

År 2018 -> 300 cyklar orsakade 30 olyckor

År 2019 -> 400 cyklar orsakade 5 olyckor

Jag vill nu skatta en frekvens för antalet olyckor på cykel per år. Jag kan då antingen välja att göra detta genom att dela antalet olyckor med summan av alla "cykelår": f = 55/1050 = 0,05 olyckor/cykelår.

Ett annat tänkbart sätt är att räkna ut frekvensen varje år för sig:

5/50 + 5/100 + 10/200 + 30/300 + 5/400 = 0,1 + 0,05 + 0,05 +0,1 + 0,0125 = 0,3125 olyckor per år. Delar vi detta värde med antalet år, 5, så får vi medelvärdet för frekvensen f = 0,0625.

Min fråga är alltså, vilket är egentligen det "riktiga" sätter att göra detta på? Och om jag vill tillsätta en fördelning till dessa skattningar, så om jag förstått min lärare rätt, så kommer det senare exemplet med "stickprovsmedelvärdena" att kunna approximeras med normalfördelning? 

Albiki 5096 – Fd. Medlem
Postad: 16 dec 2020 23:20 Redigerad: 16 dec 2020 23:20

Hej,

När du kombinerar flera skattningar p^k\hat{p}_k av andelen pp bör du på något sätt ta hänsyn till stickprovsstorlekarna nkn_k för respektive skattning. En viktad skattning

    k=15λkp^k\displaystyle\sum_{k=1}^{5}\lambda_k \hat{p}_k

där vikterna λk\lambda_k summeras till 11 för att få väntevärdesriktig skattning är bättre än den som du använder; din skattning använder samma vikt λk=15\lambda_k = \frac{1}{5}. Vikterna λk\lambda_k väljs så att variansen för den viktade skattningen är minimal.

Albiki 5096 – Fd. Medlem
Postad: 16 dec 2020 23:24

Om skattningarna p^k=Yk/nk\hat{p}_k=Y_k/n_k är oberoende så är YkY_k binomialfördelade Bin(nk,p)\text{Bin}(n_k,p) varför deras varians är Var(p^k)=p(1-p)nk\text{Var}(\hat{p}_k) = \frac{p(1-p)}{n_k} vilket ger variansen för viktad skattning

    Vark=15λkp^k=p1-p·k=15λk2nk\displaystyle\text{Var}\left(\sum_{k=1}^{5}\lambda_k \hat{p}_k\right) = p\left(1-p\right)\cdot \sum_{k=1}^{5}\frac{\lambda_k^2}{n_k}

Albiki 5096 – Fd. Medlem
Postad: 16 dec 2020 23:26

Problemet handlar om att finna (λ1,,λ5)(\lambda_1, \ldots,\lambda_5) som minimerar k=15λk2nk\sum_{k=1}^{5}\frac{\lambda_k^2}{n_k} under bivillkoret k=15λk=1\sum_{k=1}^{5}\lambda_k=1.

Zebrakadabra 6 – Fd. Medlem
Postad: 17 dec 2020 18:09

Tack för ditt svar. Men om man använder din metod, ger detta då en "bättre" skattning än f=55/1050?

Albiki 5096 – Fd. Medlem
Postad: 17 dec 2020 18:33

Ja, det är vitsen med metoden; den ger en skattning som har minsta möjliga varians, alltså det bästa möjliga användandet av de fem skattningarna p^k\hat{p}_k.

Svara
Close