Uge 2: Øvelser#
Opgaverne er håndregningsopgaver med mindre andet er angivet (fx at du bliver bedt om at plotte en graf eller udregne en eksponentialfunktion).
Opgaver – Store Dag#
1: Jacobi-matricer for forskellige funktioner#
Vi definerer funktioner nedenfor af formen \(\pmb{f}: \operatorname{dom}(\pmb{f}) \to \mathbb{R}^k\), hvor \(\operatorname{dom}(\pmb{f}) \subseteq \mathbb{R}^n\) og hvor \(n\) og \(k\) kan aflæses af funktionsforskriften. Vi vil i denne opgave ikke bekymre os om at finde den præcise definitionsmængde \(\operatorname{dom}(\pmb{f})\), men blot nævne at hvis fx \(\ln(x_3)\) indgår i funktionsforeskriften, så må man jo kræve at \(x_3 > 0\).
Spørgsmål a#
Lad \({f}(x_1, x_2, x_3) = x_1^2x_2 + 2x_3\). Beregn Jacobi-matricen \(J_{f}(\pmb{x})\) og evaluer den i punktet \(\pmb{x} = (1, -1, 3)\). Bekræft at Jacobi-matricen for en skalar-funktion af flere variable kun har én række.
Lad \(\pmb{f}(x) = (3x, x^2, \sin(2x))\). Beregn Jacobi-matricen \(J_{\pmb{f}}(x)\) og evaluer den i punktet \(x = 2\). Bekræft at Jacobi-matricen for en vektor-funktion af én variabel kun har én søjle.
Lad \(\pmb{f}(x_1, x_2) = (x_1^2, -3x_2, 12x_1)\). Beregn Jacobi-matricen \(J_{\pmb{f}}(\pmb{x})\) og evaluer den i punktet \(\pmb{x} = (2, 0)\).
Lad \(\pmb{f}(x_1, x_2, x_3) = (x_2 \sin(x_3), 3x_1x_2 \ln(x_3))\). Beregn Jacobi-matricen \(J_{\pmb{f}}(\pmb{x})\) og evaluer den i punktet \(\pmb{x} = (-1, 3, 2)\).
Lad \(\pmb{f}(x_1, x_2, x_3) = (x_1 e^{x_2}, 3x_2 \sin(x_2), -x_1^2 \ln(x_2 + x_3))\). Beregn Jacobi-matricen \(J_{\pmb{f}}(\pmb{x})\) og evaluer den i punktet \(\pmb{x} = (1, 0, 1)\).
Note
Når du skal evaluere Jacobi-matricen, skal du ikke angive decimaltal. Du skal angive den præcise værdi som fx kan indeholde \(\cos(4)\) og \(\ln(2)\).
Spørgsmål b#
Alle funktionerne fra forrige spørgsmål er differentiable. Hvordan kan man argumentere for dette? For hvilke af funktionerne kan vi udregne Hesse-matricen? (eng: the hessian). Udregn Hesse-matricen for de af funktionerne hvor Hesse-matricen er defineret.
Spørgsmål c#
Lad \(\pmb{v} = (1,1,1)\). Normaliser vektoren \(\pmb{v}\) og kald denne \(\pmb{e}\). Tjek at \(||\pmb{e}||=1\). Udregn den retningsafledte af skalar-funktionen \({f}(x_1, x_2, x_3) = x_1^2x_2 + 2x_3\) i punktet \(\pmb{x} = (1, -1, 3)\) i retningen \(\pmb{v}\). Udregn bagefter \(J_f(\pmb{x}) \pmb{e}\). Sammenlign med den retningsafledte. Er de ens? I så fald: er det et tilfælde?
2: Jacobi-matricen for et Neuralt Netværk#
Vi betragter et neuralt netværk \(\Phi: \mathbb{R}^2 \to \mathbb{R}^3\) med ét skjult lag. Netværket sender et input \(\pmb{x}\) til et output \(\pmb{y}\) gennem følgende trin:
Affin transformation (Lag 1): \(\pmb{z} = W_1 \pmb{x} + \pmb{b}_1\). Vi skriver \(T_{W_1,\pmb{b}_1}(\pmb{x}) = W_1 \pmb{x} + \pmb{b}_1\).
Aktivering (ReLU): \(\pmb{h} = \pmb{ReLU}(\pmb{z})\)
Lineær transformation (Output uden aktivering): \(\pmb{y} = W_2 \pmb{h}\). Vi skriver \(L_{W_2}(\pmb{h}) = W_2 \pmb{h}\).
Altså er sidste aktiveringsfunktion identiteten.
Parametrene er givet ved:
Vi ønsker at bestemme Jacobi-matricen \(J_{\Phi}(\pmb{x})\).
Spørgsmål a#
Vi betragter først den skalare ReLU-funktion \(\sigma = \text{ReLU}\) fra \(\mathbb{R}\) til \(\mathbb{R}\). Find et udtryk for \(\sigma'(z)\) givet ved en gaffelfunktion. Udtrykket er ikke defineret for \(z=0\). Hvorfor? Find dernæst et udtryk for \(\pmb{J}_{\pmb{\operatorname{ReLU}}}\) for ReLU-vektorfunktionen fra \(\mathbb{R}^2\) til \(\mathbb{R}^2\).
Vi skriver \(\Lambda = \pmb{J}_{\pmb{\operatorname{ReLU}}}\) i resten af opgaven.
Hint
Dit svar må godt indeholde udtryk af formen \(\sigma'(z_i)\). Vi kender jo allerede denne funktion (via gaffeludtrykket).
Spørgsmål b#
Find Jacobi-matricerne for de to funktioner fra hhv trin 1 og 3.
Hint
Du skal finde \(\pmb{J}_{T_{(W_1,\pmb{b}_1)}}\) og \(\pmb{J}_{L_{W_2}}\). Lad os for korthedsskyld benævne dem \(\pmb{J}_{T}\) og \(\pmb{J}_{L}\).
Spørgsmål c#
Benyt kædereglen til at opstille et generelt udtryk for Jacobi-matricen \(J_{\Phi}(\pmb{x})\).
Hint
Udtrykket skal bestå af produktet af de tre Jacobi-matricer \(\pmb{J}_{T}\), \(\pmb{J}_{L}\) og \(\Lambda(\pmb{z})\) i en passende rækkefølge. Tjek den generaliserede kæderegel og tænk over hvad \(\pmb{z}\) er.
Hint
Udtrykket indeholder kun: \(W_2\), \(W_1\) og diagonalmatricen \(\Lambda\).
Spørgsmål d#
Vi betragter nu det specifikke input \(\pmb{x}_0 = \begin{bmatrix} 0 \\ 2 \end{bmatrix}\). Find Jacobi-matricen \(J_{\Phi}(\pmb{x}_0)\).
Hint
Start med at finde \(\pmb{z}\). Hvis en koordinat i \(\pmb{z}\) er positiv, sæt 1 på diagonalen i \(\Lambda\). Hvis negativ, sæt 0. Gang derefter matricerne sammen: \(W_2 \cdot \Lambda \cdot W_1\).
Spørgsmål e#
Vi har nu fundet Jacobi-matricen \(J_{\Phi}(\pmb{x}_0)\). Hvis vi ændrer inputtet \(x_1\) med en lille værdi \(\epsilon\) (dvs. \(\Delta \pmb{x} = [\epsilon, 0]^T\)), hvor meget ændrer output-vektoren \(\pmb{y}\) sig så cirka? Brug din Jacobi-matrix til at svare.
Svar
Jacobi-matricens søjler angiver ændringen i outputtet ved ændring af en specifik input-variabel. Første søjle svarer til \(x_1\).
Outputtets første koordinat stiger med \(\epsilon\), og den anden falder med \(2\epsilon\), mens den tredje stiger mest med \(3\epsilon\).
Note
Jacobi-matricen beskriver netværkets følsomhed: Den fortæller præcis, hvor meget og i hvilken retning outputtet ændrer sig, når vi justerer inputtet en smule. Denne indsigt er vigtig i neurale netværk for at forstå, hvilke input-parametre der har størst indflydelse på resultatet.
Spørgsmål f (frivillig)#
Verificerer beregningen symbolsk i Python med SymPy. Du kan bruge dette eksempel som inspiration:
from sympy import symbols, Matrix, Max
x1, x2 = symbols('x1 x2')
x = Matrix([x1, x2])
W1 = Matrix([[1, -1], [2, 1]])
b1 = Matrix([-1, 0])
W2 = Matrix([[2, 1], [0, -3]])
z = W1 * x + b1
h = Matrix([Max(0, z[0]), Max(0, z[1])]) # ReLU(z)
y = W2 * h
J = y.jacobian(x)
J_val = J.subs({x1: 0, x2: 2})
print("Evalueret Jacobi-matrix:")
display(J_val)
Evalueret Jacobi-matrix:
3: Beskrivelse af mængder i planen#
Tegn i hvert af de fire nedenstående tilfælde en skitse af den angivne punktmængde \(\,A\,\), det indre \(\,A^{\circ}\,\), randen \(\,\partial A\,\) og afslutningen \(\,\bar{A}\,\). Undersøg endvidere, om \(\,A\,\) er åben, afsluttet eller ingen af delene. Angiv endelig, om \(\,A\,\) er begrænset eller ikke.
\(\{(x,y) \mid xy\neq 0\}\)
\(\{(x,y) \mid 0<x<1 \wedge 1\leq y\leq 3\}\)
\(\{(x,y) \mid y\geq x^2 \wedge y<2 \}\)
\(\{(x,y) \mid x^2+y^2-2x+6y\leq 15 \}\)
Hint
Papir og blyant: Tegn et koordinatsystem for hver mængde og skitsér mængden her i.
Start med simple tilfælde: Er mængden defineret ved fx en ulighed som \(y<2x\), så indtegn som hjælp \(y=2x\). Gør dette for alle uligheder og \(\neq\).
Undersøg grænserne: Bestem om randen er inkluderet eller ekskluderet (kig efter \(<\), \(>\), \(\leq\), \(\geq\)). Hvis randen ikke er inkluderet, bør randen tegnes som en stiplet linje.
Brug akserne som reference: Overvej hvordan mængden relaterer sig til \(x\)- og \(y\)-aksen.
Svar
\(\{(x,y)\,\vert\, xy\neq 0\}\) udgør den reelle talplan (\(\mathbb{R}^2\)), men uden koordinatakserne. Dette område udgør også det indre af mængden, mens randen af mængden udgøres af koordinatakserne. Afslutningen er hele den reelle talplan. Mængden er åben og ikke begrænset.
\(\{(x,y)\,\vert\, 0<x<1\wedge 1\leq y\leq 3\}\) er det rektangel, der er indsluttet af linjerne \(x=0\), \(x=1\), \(y=1\) og \(y=3\), hvor \(x=0\) og \(x=1\) ikke tilhører mængden, mens \(y=1\) og \(y=3\) tilhører mængden. Det indre af mængden er rektanglet eksklusive linjestykkerne, randen er alle fire linjestykker og afslutningen er rektanglet inklusive linjestykkerne. Mængden er hverken åben eller afsluttet, men den er begrænset.
\(\{(x,y)\,\vert\, y\geq x^2 \,\,\,\mathrm{og}\,\,\,y<2 \}\) er fællesmængden af det område som ligger over parablen med ligningen \(\,y=x^2\,\) og det område som ligger under linjen \(\,y=2\,\). Bemærk at parabelstykket fra punktet \(\,(- \sqrt{2},2)\,\) til punktet \(\,( \sqrt{2},2)\,\) pånær endepunkterne er med i mængden, mens linjestykket fra punktet \(\,(- \sqrt{2},2)\,\) til punktet \(\,( \sqrt{2},2)\,\) ikke er med. Det indre af mængden er denne fællesmængde eksklusive parabelstykket fra punktet \(\,(- \sqrt{2},2)\,\) til punktet \(\,( \sqrt{2},2)\,.\) Randen består af dette parabelstykke og linjestykket fra punktet \(\,(- \sqrt{2},2)\,\) til punktet \(\,( \sqrt{2},2)\,.\) Endelig er afslutningen området inklusive linjestykket og parabelstykket. Den givne mængde er hverken åben eller afsluttet, mens den er begrænset.
\(\{(x,y)\,\vert\, x^2+y^2-2x+6y\leq 15 \}\) udgør området indenfor cirklen med centrum i \((1,-3)\) og radius 5. Det indre er området eksklusive cirkelperiferien, randen er cirkelperiferien og afslutningen er området inklusive cirkelperiferien. Afslutningen er altså mængden selv. Mængden er afsluttet og begrænset.
4: Alle lineære afbildninger fra \(\mathbb{R^n}\) til \(\mathbb{R}\)#
Lad \(L: \mathbb{R}^n \to \mathbb{R}\) være en (vilkårlig) lineær afbildning. Lad \(e = \pmb{e}_1, \pmb{e}_2, \dots, \pmb{e}_n\) være standard-basen for \(\mathbb{R}^n\), og lad \(\beta\) være standard-basen for \(\mathbb{R}\). Husk standard basen fra Matematik 1a. Bemærk da dimensionen af \(\mathbb{R}\) (over \(\mathbb{R}\)) er en, er standard-basen for \(\mathbb{R}\) blot tallet \(1\).
Vis at der eksisterer en søjlevektor \(\pmb{c} \in \mathbb{R}^n\) således at
hvor \(\langle \cdot, \cdot \rangle\) angiver det sædvanlige indreprodukt på \(\mathbb{R}^n\). (Søjlevektoren er entydigt givet, men det er ikke en del af opgaven at argumentere for dette).
Hint
Hvad er afbildningsmatricen \({}_\beta[L]_e\) for \(L\) m.h.t. de to baser?
Svar
\(\pmb{c}^T = {}_\beta[L]_e = [L(\pmb{e}_1), L(\pmb{e}_2), \dots, L(\pmb{e}_n)]\)
5: Linæere(?) vektor funktioner#
Vi betragter følgende to funktioner:
\(f: \mathbb{R}^{2 \times 2} \to \mathbb{R}^{2 \times 2}, f(X) = C X B\), hvor \(C = \operatorname{diag}(2,1) \in \mathbb{R}^{2 \times 2}\) og \(B = \begin{bmatrix} 1 & 1 \\ 0 & 1 \end{bmatrix}\).
\(g: \mathbb{R}^n \to \mathbb{R}, g(\pmb{x}) = \pmb{x}^T A \pmb{x}\), hvor \(A\) er en \(n \times n\) matrix (og ikke nulmatricen).
Afgør for hver funktion om den er en lineær afbildning. Hvis afbildningen er lineær, find afbildningsmatricen med hensyn til, henholdsvis:
standard-basen \(E=\begin{bmatrix} 1 & 0 \\ 0 & 0 \end{bmatrix}, \begin{bmatrix} 0 & 1 \\ 0 & 0 \end{bmatrix}, \begin{bmatrix} 0 & 0 \\ 1 & 0 \end{bmatrix}, \begin{bmatrix} 0 & 0 \\ 0 & 1 \end{bmatrix}\) i \(\mathbb{R}^{2 \times 2}\). Husk dette eksempel fra Mat1a
standard-basen \(e\) i \(\mathbb{R}^n\). Husk dette result fra Mat1a
6: Den simple kæderegel#
I denne opgave skal vi arbejde med den simple kæderegel givet her.
Vi betragter først en reel funktion af to reelle variable givet ved forskriften
Spørgsmål a#
Bestem den størst mulige definitionsmængde for \(g\), og karakterisér den ved hjælp af begreber som åben, afsluttet, begrænset, ubegrænset.
Svar
Logaritmen kan kun tages af positive værdier, derfor må vi kræve
Men dette kan omskrives til \(x^2+y^2<3^2\), altså er \(\operatorname{dom}(g)=\{(x,y)\,|\,x^2+y^2<3^2\}\). Det er en cirkelskive med centrum i Origo og radius 3, men hvor periferien ikke er med. Mængden er åben og begrænset.
Vi betragter nu en parametriseret kurve \(\pmb{r}\) i \((x,y)\)-planen givet ved
Spørgsmål b#
Hvilken kurve er der tale om (du er bekendt med dens ligning)?
Svar
Det er grafen for tredjegradspolynomiet \(p(x)=x^3\,,\,\,x\in \left[-1.2\,,\,1.2\right]\).
Vi betragter nu den sammensatte funktion
Spørgsmål c#
Hvad er definitionsmændgen og dispositionsmængden for \(h = g \circ \pmb{r}\)?
Svar
\(\operatorname{dom}(h) = \left[-1.2\,,\,1.2\right]\) og \(\operatorname{co-dom}(h) = \mathbb{R}\).
Spørgsmål d#
Bestem \(h'(1)\) ved to forskellige metoder:
Bestem et funktionsudtryk for \(h(u)\) og differentiér på sædvanlig vis.
Benyt Kædereglen i Afsnit 3.7.
Svar
Vi får \(h(u)=\ln(-u^6-u^2+9)\,\) og \(h'(1)=-\frac{8}{7}\).
Tangentvektoren bestemmes: Da \(\pmb{r}'(u)=(1,3\,u^2)\) fås \(\pmb{r}'(1)=(1,3)\). Gradienten af \(\nabla f(x,y)\) findes. Herefter kan \(\nabla f(\pmb{r}(1))=\nabla f(1,1)=(-\frac{2}{7},-\frac{2}{7})\) udregnes. Det indre produkt (prikproduktet) af de to fundne vektorer er \(-\frac{8}{7}\).
7: Den generaliserede kæderegel#
I denne opgave skal vi bruge denne sætning: Generalized chain rule
Givet funktionerne:
\(\pmb{f} : \mathbb{R}^3 \to \mathbb{R}^2\) defineret ved \(\pmb{f}(x_1, x_2, x_3) = (f_1(x_1, x_2, x_3), f_2(x_1, x_2, x_3))\), hvor \(f_1(x_1, x_2, x_3) = x_1^2 + x_2^2 + x_3^2\) og \(f_2(x_1, x_2, x_3) = e^{x_1 + x_2} \, \cos(x_3)\).
\(g : \mathbb{R}^2 \to \mathbb{R}\) defineret ved \(g(y_1, y_2) = y_1 \, \sin(y_2)\).
Sammensætning af disse funktioner: \(h = g \circ \pmb{f}\).
Vi vil i opgaven beregne Jacobi-matricen af \(h\) (med hensyn til de variable \(x_1, x_2,\) og \(x_3\)) ved brug af den generaliserede kæderegel. Du må gerne lave udregningerne i SymPy.
Spørgsmål a#
Find funktionsudtrykket for \(h\) samt definitionsmængden og dispositionsmængden. Udregn gradienten af \(h\).
Spørgsmål b#
Beregn Jacobi-matricen for \(\pmb{f}\). Beregn Jacobi-matricen for \(g\). Hvad er sammenhængen mellem gradienten og Jacobi-matricen for \(g\)?
Hint
For skalære funktioner er Jacobi-matricen en rækkevektor: nemlig den transponerede (søjle)-gradientvektor.
Spørgsmål c#
Anvend nu kædereglen og Jacobi-matricerne fra forrige opgave til at finde Jacobi-matricen af \(h\). Sammenlign med svaret i Spørgsmål a.
Hint
Din anvendelse af den generaliserede kæderegel skal involvere et matrix-matrix produkt af \(1 \times 2\) og \(2 \times 3\) matricer.
Hint
Husk at du skal evaluere Jacobi-matricen/gradienten for \(g\) i det rigtige punkt, nemlig i \((y_1,y_2) = \pmb{f}(x_1, x_2, x_3)\). Dette er helt ligesom den kendte kæderegel fra gymnasiet, hvor \(g(f(x))' = g'(f(x)) f'(x)\) hvor \(g'\) på højresiden evalueres i \(f(x)\).
8: Partielle afledede men ikke differentiabel#
Vi starter med en simpel funktion \(f\), der er differentiabel overalt. Lad \(f:\mathbb{R}^2 \to \mathbb{R}\) være givet ved
Spørgsmål a#
Lad \(\pmb{x}_0 = (x_1,x_2) \in \mathbb{R}^2\) være et vilkårligt punkt. Gør rede for at \(f\) er differentiabel i \(\pmb{x}_0\) og bestem gradienten af \(f\) i \(\pmb{x}_0\).
Soft version: Benyt resultatet i denne sætning
Hard version: Løs opgaven direkte fra definitionen på differentiabilitet i afsnit 3.6. Vi følger denne fremgangsmåde i hints og svar nedenfor:
Hint
I lighed med arbejdet i gymnasiet skal vi betragte sammenhængen mellem \(\Delta f = f(\pmb{x}_0+\pmb{h}) - f(\pmb{x}_0)\) og \(\pmb{h}\) i forbindelse med grænseovergangen \(\pmb{h}\longrightarrow\pmb{0}\), men bemærk, at \(\pmb{h}\) nu er en vektor.
Hint
Sæt \(\pmb{h}=(h_1,h_2)\). Udregn \(\Delta f\).
Hint
\(\Delta f=f(x_1+h_1,x_2+h_2)-f(x_1,x_2)\).
Hint
Svar
Da \(\varepsilon (\pmb{h}) = ||\pmb{h}||\) er en epsilonfunktion, kan vi samlet skrive dette som:
hvor \(\pmb{c} =\begin{bmatrix} 2x_1-4 \\ 2x_2 \end{bmatrix}\).
Vi konkluderer at \(f\) er differentiabel i henhold til definitionen, og der gælder
Spørgsmål b#
For at konkludere differentiabilitet fra de partielle afledede, jvf. denne sætning, kræves at de partielle afledede er kontinuerte. Hvorfor er det ikke nok at de partielle afledede eksisterer? Det skal vi undersøge gennem et konkret eksempel. Men først generaliserer vi en (fra gymnasiet) velkendt sætning om en funktion af én variabel: Hvis den er differentiabel i et punkt, så er den også kontinuert i det punkt.
Vis at hvis en funktion af to variable er differentiabel i et punkt \(\pmb{x}_0\), så er den også kontinuert i det punkt.
Hint
De to definitioner kan bruges direkte (evt. kan man finde beviset i bogen).
Og nu til eksemplet, der har navngivet opgaven. Vi betragter funktionen
Spørgsmål c#
Vis at de partielle afledede af \(g\) eksisterer i \((0,0)\), men at \(g\) ikke er differentiabel i dette punkt.
Hint
Første del af spørgsmålet burde ikke være så svært: De to hjælpefunktioner \(h_{x_2}(x_1)\) og \(h_{x_1}(x_2)\) er nemlig konstante på hele \(\,x_1\)-aksen henholdsvis hele \(x_2\)-aksen. OK?
Hint
Anden del af spørgsmålet: Vi så at hvis funktionen er differentiabel i et punkt, så er den også kontinuert i punktet. Men så må der omvendt gælde at hvis funktionen ikke er kontinuert i punktet, kan den heller ikke være differentiabel i punktet. Så vi skal bare vise at \(g\) ikke er kontinuert i \((0,0)!\)
Hint
Ud fra forskriften er \(g(0,0)=0\). Men hvad går restriktionen af \(g\) til parabelbuen \(x_2=x_1^2\) imod når \(x_1\) går mod \(0\)?
Svar
Den går mod \(\frac{1}{2}\). Og så er \(g\) jo ikke kontinuert i \((0,0)\). Tænk gerne hele argumentet igennem igen.
9: Niveaukurver og retningsafledte for skalar-funktioner#
En funktion \(f:\mathbb{R}^2\rightarrow\mathbb{R}\) er givet ved forskriften
Og en anden funktion \(g:\mathbb{R}^2\rightarrow\mathbb{R}\) er givet ved forskriften
Spørgsmål a#
Beskriv niveaukurverne givet ved \(f(x,y)=c\) for værdierne \(c\in\{1,2,3,4,5\}\).
Hint
Husk cirklens ligning: \((x-a)^2+(y-b)^2=r^2\).
Svar
Niveaukurverne er cirkler, der alle har centrum i \((0,0)\). Deres radier er henholdsvis \(1,\,\sqrt 2,\,\sqrt 3,\,2,\,\sqrt{5}\,\).
Spørgsmål b#
Bestem gradienten af \(f\) i punktet \((1,1)\) og bestem den retningsafledede af \(f\) i punktet \((1,1)\) i den retning der er bestemt af enhedsretningsvektoren \(\pmb{e}=(1,0)\).
Svar
\(\nabla f(1,1)=(2,2)\). Den retningsafledede er det indre produkt (prikproduktet) af gradienten og den givne retningsvektor:
Spørgsmål c#
Beskriv niveaukurverne givet ved \(g(x,y)=c\) for værdierne \(c \in\{-3,-2,-1,0,1\}\).
Hint
Husk cirklens ligning: \((x-a)^2+(y-b)^2=r^2\).
Svar
Vi giver resultatet for den første: Idet
er niveaukurven en cirkel med centrum i \((2,0)\) og radius 1. De andre niveaukurver er også cirkler med det samme centrum, men forskellige radier.
Spørgsmål d#
Bestem gradienten af \(g\) i punktet \((1,2)\) og bestem den retningsafledede af \(g\) i punktet \((1,2)\) i retningen mod Origo \((0,0)\).
Svar
Vi starter med gradienten:
Hint
Vi skal nu bruge en enhedsvektor (unit vector) der peger fra \((1,2)\) mod Origo.
Hint
Vi kan bruge retningsvektoren \((-1,-2)\) men den skal normeres det vil sige have længden/normen 1.
Svar
Den ønskede enhedsvektor fås ved at dividere den foreslåede retningsvektor med dens norm, det vil sige:
Når vi derefter udregner det indre produkt af \(\pmb{v}\) og gradienten \(\nabla g(1,2)\), får vi den retningsafledede
10: Gradientvektorfelter og hesse-matricen#
Spørgsmål a#
Gradient-vektoren for \(f(x_1, x_2) = x_1^2 \sin(x_2)\) er \(\nabla f(\pmb{x})=(2x_1 \sin(x_2),x_1^2 \cos(x_2))\). Gradientvektoren kan derfor opfattes som en afbildning \(\nabla f : \operatorname{dom}(f) \to \mathbb{R}^2\). Nedskriv afbildningen som funktion (hvor du angiver \(\operatorname{dom}(f)\)) og plot den som et vektorfelt.
Spørgsmål b#
Udregn nu Jacobi-matricen \(\pmb{J}_{\nabla f}(x_1,x_2)\) af \(\nabla f : \mathbb{R}^2 \to \mathbb{R}^2\) i punktet \((x_1,x_2)\).
Spørgsmål c#
Udregn hesse-matricen \(\pmb{H}_{f}(x_1,x_2)\) for \(f : \mathbb{R}^2 \to \mathbb{R}\) i punktet \((x_1,x_2)\) og sammenlign med svaret i forrige opgave.
Temaøvelse – Lille Dag#
Der er tema-øvelse Tema 1: Gradientmetoden