11 svar
138 visningar
Knugenshögra behöver inte mer hjälp
Knugenshögra 101
Postad: 9 mar 2023 20:55

Beräkning av determinant i samband med optimering av ytor med bivillkor

Hej!

Sitter och läser om hur man optimerar ytor. Som jag förstår identifieras extrempunkter genom att gradienten av både funktionsytan & bivillkoret i punkten är parallella. Det medföljer då att kryssprodukten av gradienterna = 0.

Så exemplet i fråga är:

Bestäm största värdet av f(x,y,z) = x + y^2+ z på enhetssfären x^2+y^2+z^2

Gradienten beräknas då:

df(x,y,z) = (1,2y,1) de(x,y,z) = (2x,2y,2z)

Nu är min linj. alg. rätt rostig, men jag får denna vektorprodukt till

 df×de =(2y-4yz,2z-2x,4xy-2y)

Boken får dock detta till:

df×de =(2y-4xy,4yz-2y,2z-2x)

Det ser ju då ut som koordinaterna har bytt plats & tecken på några ställen, och jag förstår inte riktigt varför? 

Beräknade kryssprodukten med denna metod, med de uppe & df nere: 

Tack i förväg!

CurtJ 1190
Postad: 9 mar 2023 22:41

Ja din vektorprodukt ser riktig ut men det är de x df i den ordningen. Hur boken har kommit fram till den vektorn kan jag inte se om dina gradienter är riktiga. Däremot känner jag mig osäker (också väldigt rostig) på om det räcker att de två gradienterna ska är parallella i en extrempunkt men det kan säkert någon annan kommentera. 

Knugenshögra 101
Postad: 9 mar 2023 23:28 Redigerad: 9 mar 2023 23:51
CurtJ skrev:

Ja din vektorprodukt ser riktig ut men det är de x df i den ordningen. Hur boken har kommit fram till den vektorn kan jag inte se om dina gradienter är riktiga. Däremot känner jag mig osäker (också väldigt rostig) på om det räcker att de två gradienterna ska är parallella i en extrempunkt men det kan säkert någon annan kommentera. 

Ja ser ut som att gradienterna också ska vara = 0. Däremot så behövs tydligen inte det i denna uppgiften? Blir rätt förvirrad. Rent intuitivt känner ju jag att gradienten = 0 alltid är ett krav, vet inte riktigt hur de utesluter det i exemplet i bild 1?

Ignorera det med lambda, försöker använda metoden i bild 2.

 

D4NIEL 2885
Postad: 10 mar 2023 11:05 Redigerad: 10 mar 2023 11:14

Nej, gradienterna ska inte vara 0 när man optimerar under bivillkor. Jag tror du blandar ihop det med en helt annan situation, nämligen när man söker extrempunkter till en funktion och lokaliserar det man kallar för stationära punkter, dvs f=0\nabla f=0

Boken/du verkar också ha blandat ihop vektorproduktens komponenter, det korrekta uttrycket är

f×g=(4yz-2y,2x-2z,2y-4xy)\nabla f \times \nabla g = ( 4 y z-2 y, 2 x - 2 z, 2 y - 4 x y)

Extrempunkterna kan man finna genom att studera i vilka punkter gradienterna är parallella, dvs under vilka förutsättningar kryssprodukten blir noll.

Gör man det inser man att x=z=12x=z=\frac12

Slutligen ger bivillkoret g(x,y,z)=1y=±12g(x,y,z)=1\implies y=\pm \frac{1}{\sqrt{2}}

Största värdet fmax=32f_{max}=\frac32 inträffar i punkterna (12,±12,12)(\frac12,\pm \frac{1}{\sqrt2}, \frac12)

Notera nu att f(12,±12,12)=(1,±2,1)(0,0,0)\nabla f(\frac12,\pm\frac{1}{\sqrt2}, \frac12)=(1,\pm\sqrt 2, 1)\neq (0,0,0)

Smaragdalena 80504 – Avstängd
Postad: 10 mar 2023 11:22
Knugenshögra skrev:

Hej!

Sitter och läser om hur man optimerar ytor. Som jag förstår identifieras extrempunkter genom att gradienten av både funktionsytan & bivillkoret i punkten är parallella. Det medföljer då att kryssprodukten av gradienterna = 0.

Så exemplet i fråga är:

Bestäm största värdet av f(x,y,z) = x + y^2+ z på enhetssfären x^2+y^2+z^2

...

Här skulle jag ha bytt till polära koordinater med y som "avvikande" och räknat vidare därifrån, tagit fram y som en funktion av vinkeln v och fått f(v) som jag kunde ha deriverat.

Finns det något som gör att min metod inte skulle ha fungerat? (Det var väldigt länge sedan jag läste det här, så jag kan ha glömt ett och annat.)

Knugenshögra 101
Postad: 11 mar 2023 01:45
D4NIEL skrev:

Nej, gradienterna ska inte vara 0 när man optimerar under bivillkor. Jag tror du blandar ihop det med en helt annan situation, nämligen när man söker extrempunkter till en funktion och lokaliserar det man kallar för stationära punkter, dvs f=0\nabla f=0

Boken/du verkar också ha blandat ihop vektorproduktens komponenter, det korrekta uttrycket är

f×g=(4yz-2y,2x-2z,2y-4xy)\nabla f \times \nabla g = ( 4 y z-2 y, 2 x - 2 z, 2 y - 4 x y)

Extrempunkterna kan man finna genom att studera i vilka punkter gradienterna är parallella, dvs under vilka förutsättningar kryssprodukten blir noll.

Gör man det inser man att x=z=12x=z=\frac12

Slutligen ger bivillkoret g(x,y,z)=1y=±12g(x,y,z)=1\implies y=\pm \frac{1}{\sqrt{2}}

Största värdet fmax=32f_{max}=\frac32 inträffar i punkterna (12,±12,12)(\frac12,\pm \frac{1}{\sqrt2}, \frac12)

Notera nu att f(12,±12,12)=(1,±2,1)(0,0,0)\nabla f(\frac12,\pm\frac{1}{\sqrt2}, \frac12)=(1,\pm\sqrt 2, 1)\neq (0,0,0)

Ja jag är rätt förvirrad, förstår inte riktigt detta :s En fråga bara:

Vad betyder dg(a,b)v=0?

D4NIEL 2885
Postad: 11 mar 2023 10:46 Redigerad: 11 mar 2023 11:12
Knugenshögra skrev:

Ja jag är rätt förvirrad, förstår inte riktigt detta :s En fråga bara:

Vad betyder dg(a,b)v=0?

Det är svårt att veta utan kontext, men jag gissar att du menar riktningsderivatan, dvs förändringen av funktionen gg  i riktningen vv. Om längden av vektorn vv är ett, dvs v=1\| v \|=1 har vi

g(a,b)v=g(a,b)·v\nabla g(a,b)_{v}=\nabla g(a,b)\cdot v

Det betyder att skalärprodukten av gradienten och riktningsvektorn.

Om riktningsvektorn vv pekar utmed tangenten till en nivåkurva g(a,b)=Cg(a,b)=C så måste

g(a,b)v=0\nabla g(a,b)_{v}=0

Andra sätt att skriva riktningsderivatan är

vg=Dvg=Lvg=dg(v)=v(g)\nabla_v g=D_v g=L_vg=dg(v)=v(g)

Knugenshögra 101
Postad: 11 mar 2023 14:43
D4NIEL skrev:
Knugenshögra skrev:

Ja jag är rätt förvirrad, förstår inte riktigt detta :s En fråga bara:

Vad betyder dg(a,b)v=0?

Det är svårt att veta utan kontext, men jag gissar att du menar riktningsderivatan, dvs förändringen av funktionen gg  i riktningen vv. Om längden av vektorn vv är ett, dvs v=1\| v \|=1 har vi

g(a,b)v=g(a,b)·v\nabla g(a,b)_{v}=\nabla g(a,b)\cdot v

Det betyder att skalärprodukten av gradienten och riktningsvektorn.

Om riktningsvektorn vv pekar utmed tangenten till en nivåkurva g(a,b)=Cg(a,b)=C så måste

g(a,b)v=0\nabla g(a,b)_{v}=0

Andra sätt att skriva riktningsderivatan är

vg=Dvg=Lvg=dg(v)=v(g)\nabla_v g=D_v g=L_vg=dg(v)=v(g)

Ja jag har försökt bläddra igenom boken för att se vad de menar med det uttrycket men står inte riktigt någonstans. Skulle stå gv, inte dg!

Har funderat på detta lite nu och tror jag helt missförstått hur gradienten fungerar. Jag tänkte att gradienten på något vis pekade längst med ytan för något f(x,y) , snarare än platt i xy-riktningen vi ska röra oss i för att öka fortast haha. Fattade aldrig riktigt varför gradienten är vinkelrät mot nivåkurvor förrän nu. Tror också jag blandade ihop lite 2D & 3D fall. Är dock inte riktigt helt ombord än.

Är inte alltid f vinkelrät mot tangentplanet till ytan eftersom ytan är en nivåyta?

D4NIEL 2885
Postad: 11 mar 2023 15:28 Redigerad: 11 mar 2023 15:41

Det stämmer. Tangentplanet till en nivåyta i en given punkt är parallellt med ytan i punkten och gradienten är en normal till tangentplanet eftersom den är normal till nivåytan.

Notera dock att i det avsnitt du markerat med rött ovan pratar man om en kurva i rummet och man funderar över vilket värde riktningsderivatan (av bivillkoren) utmed kurvan måste anta när  ff antar ett extremvärde utmed kurvan.

Knugenshögra 101
Postad: 11 mar 2023 16:42 Redigerad: 11 mar 2023 16:43
D4NIEL skrev:

Det stämmer. Tangentplanet till en nivåyta i en given punkt är parallellt med ytan i punkten och gradienten är en normal till tangentplanet eftersom den är normal till nivåytan.

Notera dock att i det avsnitt du markerat med rött ovan pratar man om en kurva i rummet och man funderar över vilket värde riktningsderivatan (av bivillkoren) utmed kurvan måste anta när  ff antar ett extremvärde utmed kurvan.

Aha, så det intressanta är mer när g1,2 är vinkelrät mot kurvan i punkten. Var jag går vilse nu är dock varför g1,2 måste vara vinkelrät mot tangentplanet ( och därmed nivåytan till f) i en extrempunkt för f. Definierar inte g1,2  

riktningen med snabbast ökning i funktionsvärde för endast g? Varför spelar den riktningen roll när vi söker extrempunkter till f? Finns där någonting som gör det lättare att inse eller är det bara att tänka på det tills det går in?

D4NIEL 2885
Postad: 11 mar 2023 18:37 Redigerad: 11 mar 2023 18:51

Låt oss studera det konkreta exempel 7.6 som finns i din bok

Villkoret g1=x2+y2+z2-4=0g_1=x^2+y^2+z^2-4=0 är en nivåyta som borde vara bekant, det är en sfär med radien 2. Så här:

Det andra bivillkoret, g2=x2+y2-z2=0g_2=x^2+y^2-z^2=0 är en yta som ser ut så här:

När båda villkoren gäller samtidigt pratar man om de punkter som ligger på BÅDA nivåytorna samtidig. Då uppstår skärningslinjerna mellan de båda ytorna, så här

De två skärningslinjerna bildar slutna kurvor i 3\mathbb{R}^3. Se den röda- och blå kurvan.

En parameterframställning för den röda kurvan är

r(t)=2(cos(t),sin(t),1)\mathbf{r}(t)=\sqrt{2}(\cos(t), \sin(t), 1)

Nu undrar man alltså om funktionen f(r(t))f(\mathbf{r}(t)) antar ett extremum på kurvan och för vilket tt, eller i vilken punkt a\mathbf{a}, det kan tänkas inträffa. Derivatan i den punkten på kurvan bör vara noll, dvs

ddtf(a)=ddtf(r(t))=f·rt'(t)=0\frac{d}{dt}f(\mathbf{a})=\frac{d}{dt}f(\mathbf{r}(t))=\nabla f \cdot \mathbf{r}^\prime_t(t)=0

Vektorerna rt'\mathbf{r}^\prime_t och f\nabla f ska alltså vara vinkelräta mot varandra i punkten a\mathbf{a}. Med andra ord är f\nabla f vinkelrät mot kurvans tangentvektor. Men vektorerna g1\nabla g_1 och g2\nabla g_2 har samma egenskap eftersom den röda kurvan ligger i nivåytorna till g1g_1 respektive g2g_2.

Alltså måste f\nabla f och g1\nabla g_1 samt g2\nabla g_2 vara linjärt beroende. De ligger i samma plan, normalplanet till kurvan.

Knugenshögra 101
Postad: 11 mar 2023 22:03
D4NIEL skrev:

Låt oss studera det konkreta exempel 7.6 som finns i din bok

Villkoret g1=x2+y2+z2-4=0g_1=x^2+y^2+z^2-4=0 är en nivåyta som borde vara bekant, det är en sfär med radien 2. Så här:

Det andra bivillkoret, g2=x2+y2-z2=0g_2=x^2+y^2-z^2=0 är en yta som ser ut så här:

När båda villkoren gäller samtidigt pratar man om de punkter som ligger på BÅDA nivåytorna samtidig. Då uppstår skärningslinjerna mellan de båda ytorna, så här

De två skärningslinjerna bildar slutna kurvor i 3\mathbb{R}^3. Se den röda- och blå kurvan.

En parameterframställning för den röda kurvan är

r(t)=2(cos(t),sin(t),1)\mathbf{r}(t)=\sqrt{2}(\cos(t), \sin(t), 1)

Nu undrar man alltså om funktionen f(r(t))f(\mathbf{r}(t)) antar ett extremum på kurvan och för vilket tt, eller i vilken punkt a\mathbf{a}, det kan tänkas inträffa. Derivatan i den punkten på kurvan bör vara noll, dvs

ddtf(a)=ddtf(r(t))=f·rt'(t)=0\frac{d}{dt}f(\mathbf{a})=\frac{d}{dt}f(\mathbf{r}(t))=\nabla f \cdot \mathbf{r}^\prime_t(t)=0

Vektorerna rt'\mathbf{r}^\prime_t och f\nabla f ska alltså vara vinkelräta mot varandra i punkten a\mathbf{a}. Med andra ord är f\nabla f vinkelrät mot kurvans tangentvektor. Men vektorerna g1\nabla g_1 och g2\nabla g_2 har samma egenskap eftersom den röda kurvan ligger i nivåytorna till g1g_1 respektive g2g_2.

Alltså måste f\nabla f och g1\nabla g_1 samt g2\nabla g_2 vara linjärt beroende. De ligger i samma plan, normalplanet till kurvan.

Ahhh, blev mycket enklare att förstå när du parametriserade kurvan så. Helt sjukt vad det hjälper att se figurerna framför sig också. Enklare att hålla reda på vad som menas med tangentplanet och normalplanet. Riktigt bra förklaring! Tusen tack för hjälpen & tålamodet, skickar eviga virtuella bugningar din väg!!

Svara
Close