Formel för Kovarians
Jag har försökt förstå mig på kovarians och har stött på en mängd olika formler som säger sig beräkna samma sak(kovarians) men jag får olika svar.
Mitt problem: har en sannolikhetsfördelning enligt följande:
y/X | 0 | 1 | 2 | P(y) |
1 | 0,08 | 0,12 | 0,30 | 0,50 |
2 | 0,12 | 0,18 | 0,20 | 0,50 |
P(x) | 0,20 | 0,30 | 0,50 | 1 |
Formeln för kovarians jag sett om och om igen är: summan av (xi-xmedelvärde) x (yi - ymedelvärde) dividerat på n-1
x-medelvärdet är = 1,3 och y-medelvärdet= 1,5
Beräkningar:
x | y | (xi-xmedel) | (yi-ymedel) | (xi-xmedel) x (yi-ymedel) |
0 | 1 | -1,3 | -0,5 | 0,65 |
1 | 2 | -0,3 | 0,5 | -0,15 |
2 | 0,7 | 0,7 |
Summan blir då 0,65 + (-0,15) + 0,7= 1,2 sedan 1,2/4 = 0,3
Min kursbok säger dock att svaret ska vara -0.07 och har använt en helt annan formel:
E(X gånger Y) - E(x) x E(Y)
Jag är verkligen helt vilsen i vilken formel som stämmer och all hjälp uppskattas!
Vart tog sannolikheterna vägen i din formel?
Varför dividerar du med 4 i st f med 5 ?
Den vanliga beräkningsformeln är E(XY) - E(X)E(Y)
Arktos skrev:Vart tog sannolikheterna vägen i din formel?
Varför dividerar du med 4 i st f med 5 ?
Den vanliga beräkningsformeln är E(XY) - E(X)E(Y)
Har inte den blekaste vart dem tar vägen. Detta är bara formeln jag ser överallt som tydligen är formeln för just kovarians. Antog att det var något slags urval och då är det ju alltid n-1
Den formel du tittat på används när du har data, xi och yi skulle vara ett datasampel, och totalt har du n stycken.
I princip kanske man kan använda den om man bortser från n-1 och använder sannolikheter istället, men jag skulle nog inte gjort det.
Här är det inget urval.
Här gäller det kovariansen mellan två diskreta variabler
med kända sannoikhetsfunktioner.
Din formel ska också innehålla alla kombinationer av värden på X och Y.
Alla termer av typen (E(X) – xi )*(E(Y) – xj )*P[X=xi & Y=yj]
Det är därför beräkningsformeln är bekvämare att använda.
Arktos skrev:Här är det inget urval.
Här gäller det kovariansen mellan två diskreta variabler
med kända sannoikhetsfunktioner.Din formel ska också innehålla alla kombinationer av värden på X och Y.
Alla termer av typen (E(X) – xi )*(E(Y) – xj )*P[X=xi & Y=yj]
Det är därför beräkningsformeln är bekvämare att använda.
Aha, Då fattar jag! Tusen tack!
Bra! Då är vi nöjda.