11 svar
175 visningar
WilleWillesson behöver inte mer hjälp
WilleWillesson 19 – Fd. Medlem
Postad: 17 aug 2020 13:59

Sannolikheten för att ett slumpat värde är större än ett annat

Min rubrik är kanske inte klockren, men det jag undrar är följande:

Jag har två slumpgeneratorer som kastar ur sig värden vilka är normalfördelade. Slumpgenerator nr 1 har visat sig ge ett väntevärde på 200 och en standardavvikelse på 10 (dvs 5% spridning). Generatorn nr 2 har visat sig ge ett väntevärde på 350 och denna har 10% spridning (dvs sigma=35).

 

Jag undrar nu vad sannolikheten är att generator nr 1 ger ett värde som är lika med eller större än det som ges av nr 2 om jag bara kör varje generator en gång, dvs bara ett enda värde ges av varje generator. De är oberoende av varandra ska jag väl tillägga. Hur räknat jag ut detta? Hur ser det analytiska uttrycket ut? Jag hade för mig att det var något i stil med

P = integral( f(x)*integral(g(x)dx )dx där "f" är normalfördelningsfunktionen för generator nr 1 och "g" är för generator nr 2. Men jag får inget vettigt ur detta. Är det fel eller sätter jag integrationsgränserna fel?

 

Tack!  

  

Dr. G 9500
Postad: 17 aug 2020 14:08

Titta på differensen generator 1 - generator 2. Vilken fördelning har den? 

WilleWillesson 19 – Fd. Medlem
Postad: 17 aug 2020 14:12

Hm ja jag antar att det den också är normalfördelad? Men egentligen skulle jag vilja lösa det med ett analytiskt uttryck så att man kan ha med olika fördelningar. T.ex om f är lognormalfördelad och g är normalfördelad, eller vad som helst.

Albiki 5096 – Fd. Medlem
Postad: 17 aug 2020 15:39 Redigerad: 17 aug 2020 15:44

Hej Wille,

Om X och Y båda är kontinuerliga slumpvariabler med samma värdemängd (DD) så beräknas den sökta sannolikheten som 

    P(X>Y)=yDP(X>y|Y=y)fY(y)dyP(X>Y) =\int_{y\in D}P(X>y | Y=y)f_{Y}(y)\,dy

Om slumpvariablerna dessutom är oberoende är P(X>y|Y=y)=P(X>y)=1-FX(y)P(X>y|Y=y) = P(X>y) = 1-F_{X}(y) vilket ger 

P(X>Y)=yD(1-FX(y))fY(y)dy=1-yDFX(y)fY(y)dy,P(X>Y) = \int_{y\in D}(1-F_{X}(y))f_{Y}(y)\,dy = 1-\int_{y\in D}F_{X}(y)f_{Y}(y)\,dy,

där fYf_{Y} betecknar täthetsfunktionen för YY och FXF_{X} betecknar fördelningsfunktionen för XX.

Notera att beräkningen inte behöver att XX och YY har samma värdemängd DD, utan endast att värdemängden för YY är en delmängd av värdemängden för XX,

    DYDX.D_{Y} \subseteq D_{X}.

Albiki 5096 – Fd. Medlem
Postad: 17 aug 2020 15:43

Om de kontinuerliga slumpvariablerna XX och YY är beroende så behöver du känna till deras gemensamma täthetsfunktion (f(X,Y)f_{(X,Y)}) för att kunna beräkna den sökta sannolikheten, som är en dubbelintegral över området EE

    P(X>Y)=Ef(X,Y)(x,y)dxdyP(X>Y) = \iint_{E}f_{(X,Y)}(x,y)\,dxdy

där E={(x,y)DX×DY:x>y}.E=\{(x,y)\in D_{X}\times D_{Y} : x>y\}. 

WilleWillesson 19 – Fd. Medlem
Postad: 17 aug 2020 16:07

@Albiki tack för svaret! Ditt uttryck 1-integral Fx(y)*fy(y)dy, är inte det egentligen det jag skrev i min text? Bortsett från "1-" då.

Fx är väl den kumulativa sannolikheten för fördelningen för ökande y? Alltså Fx(y)=integral (fx(y))dy? Dvs jag kommer stå med två integraler som skall lösas. Vad sätter jag integrationsgränserna till för att det ska bli rätt?

Albiki 5096 – Fd. Medlem
Postad: 17 aug 2020 16:15

Hej,

Integralen DFX(y)fY(y)dy\int_{D}F_{X}(y)f_{Y}(y)\,dy är lika med sannolikheten P(XY)P(X \leq Y), vilket är sannolikheten för komplementhändelsen till X>YX > Y; du ville ju veta sannolikheten att enda variabeln är större än den andra.  

Albiki 5096 – Fd. Medlem
Postad: 17 aug 2020 16:17

Man säger inte att FXF_X är den kumulativa sannolikheten för fördelningen för ökande y. Funktionen FXF_X är den kumulativa fördelningen för XX, eller kortare: Fördelningsfunktionen för XX.

WilleWillesson 19 – Fd. Medlem
Postad: 17 aug 2020 16:20
Albiki skrev:

Hej,

Integralen DFX(y)fY(y)dy\int_{D}F_{X}(y)f_{Y}(y)\,dy är lika med sannolikheten P(XY)P(X \leq Y), vilket är sannolikheten för komplementhändelsen till X>YX > Y; du ville ju veta sannolikheten att enda variabeln är större än den andra.  

Absolut, du har rätt. Så utrycket involverar två integraler. fx kommer bli integrerat två gånger och fy en gång. Men,  givet vad jag skrivit i min text, vad skall nu integrationsgränserna sättas till?

Albiki 5096 – Fd. Medlem
Postad: 17 aug 2020 16:22

Vad gäller "integrationsgränserna" så ges de av området DD; det är inte säkert att DD är en rektangel, vilket är vad du antyder när du pratar om integrationsgränser. Kom ihåg att vi arbetar med en dubbelintegral över ett område i planet och detta område behöver inte vara en rektangel.

Det vore skönt om DD var en rektangel och det kanske går att finna en bijektiv transformation av DD som ger en rektangel, men det är ett separat problem som behöver lösas innan sannolikheten kan beräknas.

WilleWillesson 19 – Fd. Medlem
Postad: 17 aug 2020 16:58

Ok... Tack för era svar. Det verkar som om jag får göra som Dr. G föreslog.

 

x=μ1-μ2σ12+σ22=-4.1208

Den standardiserade normalfördelningsfunktionen ger sannolikheten som

Φ(x)=12π-x e-t22dt = 1.8535e-05

Dvs ca 2 på 100 000 att generator nr1 ger ett större värde än generator nr2 på ett försök.

Albiki 5096 – Fd. Medlem
Postad: 18 aug 2020 14:37 Redigerad: 18 aug 2020 14:37

Om XX är normalfördelad med väntevärde μX\mu_{X} och varians σX2\sigma_{X}^2 och oberoende av YY som är normalfördelad med väntevärde μY\mu_{Y} och varians σY2\sigma_{Y}^2 så är differensen X-YX-Y normalfördelad N(μX-μY,σX2+σY2)N(\mu_{X}-\mu_{Y},\sigma_X^{2}+\sigma_Y^2), vilket medför att den standardiserade differensen ZZ är normalfördelad N(0,1)N(0,1) där

    Z=(X-Y)-(μX-μY)σX2+σY2.Z=\frac{(X-Y)-(\mu_X-\mu_Y)}{\sqrt{\sigma_X^2+\sigma_Y^2}}.

Den sökta sannolikheten kan då beräknas som

    P(X>Y)=P(X-Y>0)=PZ>0-(μX-μY)σX2+σY2=1-Φ-μX-μYσX2+σY2P(X>Y) = P(X-Y>0) = P\left(Z>\frac{0-(\mu_X-\mu_Y)}{\sqrt{\sigma_X^2+\sigma_Y^2}}\right)=1-\Phi\left(-\frac{\mu_X-\mu_Y}{\sqrt{\sigma_X^2+\sigma_Y^2}}\right)

där Φ\Phi betecknar fördelningsfunktionen för N(0,1)-fördelningen.

Om μX=200\mu_X=200 och σX=10\sigma_X=10 samt μY=350\mu_Y=350 och σY=35\sigma_Y=35 så är det mycket ovanligt att en simulering av XX ger ett större värde än en simulering av YY; sannolikheten för att detta ska uppstå är 

    P(X>Y)=1-Φ(4.12)0.P(X>Y) = 1-\Phi(4.12) \approx 0.  

Svara
Close