Statistik - korrelation
μX och μY är medelvärdet eller väntevärdet av S.V X respektive Y antar jag.
D(X) och D(Y) är standardavvikelsen av X respekive Y.
Jag förstår omskrivningen man gör s.a man får det till olikheten -1≤p≤1.
Däremot förstår jag inte deras kommentar ang hur värdet av a påverkar korrelationen p till att bli 1 eller -1.
Jag antar att jag beräknar fel men såhär tänker jag:
De antar att om det råder ett linjärt förhållande mellan X och Y s.a Y=aX+b, då har vi alltså
μY=E(Y),μX=E(X) och E(Y)=aE(X)+b
Y-E(Y)=(aX+b)-(aE(X)+b)=aX-aE(X)=a(X-E(X))
D(Y)=√E[(Y-μY)2]=√E[a2*(X-μX)2]=√a2*E[(X-μX)2]=a*√E[(X-μX)2]=a*D(X)
Så inom uttrycket kan vi förenkla den ena termen
Y-μYD(Y)=Y-E(Y)D(Y)=a*(X-E(X))a*D(X)=(X-E(X))D(X)
Så man ser att a faktorn försvinner, vilket betyder att värdet på a spelar ingen roll. Men jag måste såklart anta att jag tänkt fel, eftersom uttrycket också blir lite konstig.
Din räkning stämmer helt, bortsett från att √a2=|a|, inte a. Men de har inte antagit det linjära förhållandet, utan de har antagit att |ρ|=1, sett att det betyder att X-μXD(X)=±Y-μYD(Y) och utvecklat därifrån.
haraldfreij skrev:Din räkning stämmer helt, bortsett från att √a2=|a|, inte a. Men de har inte antagit det linjära förhållandet, utan de har antagit att |ρ|=1, sett att det betyder att X-μXD(X)=±Y-μYD(Y) och utvecklat därifrån.
Jag antar att det som får mig att tro att de antog att det existerade linjär förhållande mellan X och Y var för att de i texten säger |ρ|=1 omm olikheten sätts till 0 omm X och Y är linjärt beroende där Y=aX+b, så det låter som om det råder ekvivalens mellan dessa.
Och jag antar att du fick likheten X-μXD(X)=±Y-μYD(Y) eftersom du vill få hela väntevärdet till 0 såsom de säger.
Fortfarande tycker jag inte detta ger mig klarhet i hur värdet av a påverkar värdet av ρ. Hur kan jag se exempelvist att om a>0 så blir p=1?
bump
Du börjar med att skriva
"Däremot förstår jag inte deras kommentar ang hur värdet av a påverkar korrelationen p till att bli 1 eller -1."
Du visar sedan dina egna beräkningar där faktorn a försvinner.
haraldfreij har redan förklarat felet i dina beräkningar, där du satt a i stället för |a|.
Om du går tillbaka till dina beräkningar och ersätter a med |a| i uttrycket för D(Y) bör det bli uppenbart på vilket sätt det spelar roll om a>0 eller om a<0.