Statistik - centrala gränsvärdessatsen/observationer av stickprovsmedelvärden
Uppgiften:
I Excel kan man generera observationer av likformiga diskreta slumpvariabler som tar värden 0,1,2 med hjälp av kommandot =SLUMP.MELLAN(0;2) i svenskspråkig Excel eller =RANDBETWEEN(0;2) i engelskspråkig Excel. För en sådan slumpvariabel, kalla den , gäller alltså att . I deluppgifterna 1 och 2 menar vi slumpvariabler definierat enligt ovan även om det bara står slumpvariabel/slumpvariabler.
1) Vi ska alltså skapa observationer av stickprovsmedelvärden . Hur ska du göra/skriva i Excel (eller ditt favoritprogram) för att få observationer av stickprovsmedelvärden baserade på fem observationer av slumpvariabler? Svara gärna med hjälp av en skärmdump (snipping tool) och förklarande text. (0.2p)
2) Skapa 100 standardiserade (dvs subtrahera och dividera med ) stickprovsmedelvärden, vart och ett baserat på 2 observationer av slumpvariabler, och gör histogram för de 100 standardiserade stickprovsmedelvärdena. Upprepa proceduren för stickprovsstorlekarna 5, 10, 20 och 40. (Tips: Gör ett Excel-ark för varje stickprovsstorlek, alltså ett med 100 stickprovsmedelvärden baserade på stickprov av storlek , ett med 100 stickprovsmedelvärden baserade på stickprov av storlek osv…) Histogrammen ska vara inkluderade i rapporten och det ska tydligt framgå vilka stickprovsstorlekar som använts för stickprovsmedelvärdena som histogrammen baseras på.* (0.5p)
Tankesätt för fråga 1:
I excel skriver man in slump formula mellan 0;2. Man drar den sedan ner 5 rader. Från dessa slumpvis valda nummer tar man medelvärdet.
Tankesätt 2:
Frågan är hur man börjar att skapa 100 standardiserade stickprovsmedelvärden, baserat på 2 observationer av slumpvariabler. Vilka nummer är det man ska använda i z-formulen?
Jag antar att man bör göra två kolumner med 100 rader av slumpvärden.
Sedan ska du subtrahera medelvärdet av kolumnerna och dividera med standardavvikelsen.
När jag räknat medelvärdet på de två kolumnerna, vad är det jag ska subtrahera medelvärdet med? 100?
Stokastisk skrev :Jag antar att man bör göra två kolumner med 100 rader av slumpvärden.
Sedan ska du subtrahera medelvärdet av kolumnerna och dividera med standardavvikelsen.
När jag räknat medelvärdet på de två kolumnerna, vad är det jag ska subtrahera medelvärdet med? 100?
Ah, det blev kanske dumt att skriva att du ska subtrahera med medelvärdet. Det jag menar är att du ska subtrahera med väntevärdet. Jag antar att de menar att du ska beräkna
Där är medelvärdet av kolumnerna och E[X] är väntevärdet för slumpvariabeln, vilket är 1 i detta fall. Och V[X] är variansen för slumpvariabeln vilket är 2/3 i detta fall, samt att n är antalet observationer.
Stokastisk skrev :Ah, det blev kanske dumt att skriva att du ska subtrahera med medelvärdet. Det jag menar är att du ska subtrahera med väntevärdet. Jag antar att de menar att du ska beräkna
Där är medelvärdet av kolumnerna och E[X] är väntevärdet för slumpvariabeln, vilket är 1 i detta fall. Och V[X] är variansen för slumpvariabeln vilket är 2/3 i detta fall, samt att n är antalet observationer.
Stort tack!!! Hur får du fram 2/3 som varians? Sedan, borde jag räkna medelvärdet för en kolumn och göra uträkningen två gånger eller räkna medelvärde från båda kolumnerna? Detta är hur jag räknar. Missar jag något i min beräkning?
Variansen får man från
Ah, jag skrev fel, du ska räkna medelvärdet av raderna, inte kolumnerna. Så du får 100 stycken medelvärden av två stycken observationer vardera.