Bonferroni vid parvisa jämförelser för Anova, sätter medvetet fel frihetsgrad?
Hej, en liten fundering bara. Vid följande uppgift:
När vi beräknar för vanlig t-distribution i ANOVA-fallet har vi lärt oss en beräkning som ger följande:
Här gör vi alltså en parvis jämförelse mellan u och v som är två olika treatment groups, s_p deras pooled variance, dom har lika många observationer så därför får vi sqrt(2/n).
Men, varför kollar vi för en frihetsgrad på 60? Självklart kommer vi få ett tightare intervall än vad vi egentligen ska få då detta inte alls har en t-fördelning på t(60).
Hade vi bara haft u och v och testat för om dom har samma väntevärde hade vi ju kört:
Där n_1+n_2-2 = 7+7-2 =12, alltså en t-fördelning på t(12).
Så det känns som vi medvetet orsakar lägre p-värde för att sen korrigera det genom Bonferroni. Hade vi fått ett korrekt värde om vi INTE hade bonferroni-justerat och istället använt "rätt" frihetsgrad för var och en av dom parvisa jämförelserna?
Mvh
OM man antar att standardavvikelsen är samma för alla tio behandlingarna är väl 60 frihetsgrader motiverad ?!
Hmm, detta står inte i uppgiften men låt oss utgå från att X_1 ~ N(mu1, sigma1), ..., X_10 ~ N(mu10, sigma10), alltså vi utgår från att dom i var och en av behandlingsgrupperna kommer från samma fördelning. Varför är 60 frihetsgrader motiverat? Jag är ganska ny på Anova och sannolikhet. Om jag kollar i R t.ex så ser jag att t(60) med alpha 0,0005 ger högre t-värde än t(12) med 0,025. Så det besvarar väl min fråga. Men jag förstår inte riktigt varför det är fel att, med ovan antagande, göra ett t-test för två stickprov där jag utgår från en t(12) fördelning.
70 observationer minus 10 förbrukade på medelvärden ger 60 frihetsgrader kvar - gammal tumregel.
Tack för svar. Den tumregeln ska jag komma ihåg!
Jag förstår dock inte riktigt vad som är fel med att betrakta två behandlingsgrupper som två stickprov från två olika normalfördelningar (givet de förutsättningar jag nämnde i mitt andra inlägg). Varför skulle det inte ge mig den t-fördelning som jag menar att slumpvariabeln får?
Det kan inte vara fel snarare föredömligt försiktigt om man inte har bra stöd för att varianserna är lika
Aha okej, jag är (väldigt) ny även på R men på bilden nedan tolkar jag det som att jag får ett tightare intervall när jag kör t(12)-fördelningen än om jag kör t(60) med alpha 0.025/45. Om det stämmer innebär det väl snarare att det är oförsiktigt (och kanske fel?) av mig att köra t(12)-fördelning?
t(12) med alpha 0.025 ger t-värde = 2.1788 (stämmer med tabellen i boken)
t(60) med alpha 0.025/45 ger t-värde = 3.42019 (kan ej kolla i boken för har ej den signifikansnivån men ser ut att stämma när jag kollar intilliggande värden)