Normalfördelat eller ickenormalfördelat?
Hej!
Jag har en uppgift i statistik där jag ska undersöka skillnader mellan två stickprov - hur många som handlar ekologiska bananer vs hur många som handlar icke ekologiska bananer i livsmedelsbutikerna Ica och Coop. I undersökningen ingår 10 butiker varav 5 är Ica och 5 är Coop. Vad jag förstår räknas det som två stickprov (n), ett på Ica och ett på Coop, trots att de är utförda på 5 butiker vardera. Då det är just skillnaden mellan två stickprov vet jag att ett t- test är lämpligt. Jag vet att ett t- test är ett parametriskt test som utförs på normalfördelad data och att jag vid icke normalfördelad data ska använda mig utav ett Wilcoxon test.
Frågeställningen är alltså: Finns det någon skillnad i konsumtionsmönstren gällande ekologiska respektive konventionella bananer? Vad väljer konsumenterna i störst utsträckning?
Jag använder mig utav programmet R för att göra ett t- test för oberoende data, baserat på grupp. Dvs:
Ekologiska bananer på Coop jämfört med ekologiska bananer på Ica
Vanliga bananer på Coop jämfört med vanliga bananer på Ica
För att sedan svara på frågeställningen tänker jag att jag jämför medelvärdesskillnaden mellan vanliga bananer för Coop vs ekologiska bananer på Coop och sedan gör detsamma för Ica.
Jag anser att jag har normalfördelad data när jag avläser A2-A6, B2-B6, A7-A11 samt B7-B11 då värdena är hyfsat normalfördelade efter medelvärdet. Men när jag gör ett histogram i programmet R så ser datan inte normalfördelad ut. Vad gör jag för fel? Är datan inte normalfördelad, så att jag bör byta ut t- test mot ett Wilcoxon? Har jag tänkt fel i min metod när jag ska besvara min frågeställning?
Vore mycket tacksam om nån vet svaret på dessa frågor!
Siffrorna representerar antalet personer som har köpt antingen vanliga eller ekologiska bananer i varje butik
Andelen eko är p=40/190 om jag räknat rätt. Nollhypotesen är att samma p gäller i Ica och i Coop. Kan Icas lägre andel 14/92 vara en ren slump? Vad är sannolikheten för 14 eller lägre i en binomialfördelning med medelvärde 92p? Om den sannolikheten är mindre än 0,05 skiljer sej Ica och Coop signifikant. Binomialfördelningen brukar approximeras med N(np,np(1-p)).
Tusen tack för hjälpen, det löste sig!