Skatta en frekvens på olika sätt
Hej, jag har följande fråga:
Låt oss säga att antalet cykelolyckor per antalet cyklar i en viss stadsdel de senaste fem åren har sett ut som följande (en inte helt rimlig frågeställning kanske, men det är egentligen oväsentligt):
År 2015 -> 50 cyklar orsakade 5 olyckor
År 2016 -> 100 cyklar orsakade 5 olyckor
År 2017 -> 200 cyklar orsakade 10 olyckor
År 2018 -> 300 cyklar orsakade 30 olyckor
År 2019 -> 400 cyklar orsakade 5 olyckor
Jag vill nu skatta en frekvens för antalet olyckor på cykel per år. Jag kan då antingen välja att göra detta genom att dela antalet olyckor med summan av alla "cykelår": f = 55/1050 = 0,05 olyckor/cykelår.
Ett annat tänkbart sätt är att räkna ut frekvensen varje år för sig:
5/50 + 5/100 + 10/200 + 30/300 + 5/400 = 0,1 + 0,05 + 0,05 +0,1 + 0,0125 = 0,3125 olyckor per år. Delar vi detta värde med antalet år, 5, så får vi medelvärdet för frekvensen f = 0,0625.
Min fråga är alltså, vilket är egentligen det "riktiga" sätter att göra detta på? Och om jag vill tillsätta en fördelning till dessa skattningar, så om jag förstått min lärare rätt, så kommer det senare exemplet med "stickprovsmedelvärdena" att kunna approximeras med normalfördelning?
Hej,
När du kombinerar flera skattningar av andelen bör du på något sätt ta hänsyn till stickprovsstorlekarna för respektive skattning. En viktad skattning
där vikterna summeras till för att få väntevärdesriktig skattning är bättre än den som du använder; din skattning använder samma vikt . Vikterna väljs så att variansen för den viktade skattningen är minimal.
Om skattningarna är oberoende så är binomialfördelade varför deras varians är vilket ger variansen för viktad skattning
Problemet handlar om att finna som minimerar under bivillkoret .
Tack för ditt svar. Men om man använder din metod, ger detta då en "bättre" skattning än f=55/1050?
Ja, det är vitsen med metoden; den ger en skattning som har minsta möjliga varians, alltså det bästa möjliga användandet av de fem skattningarna .