Uge 2: Øvelser

Uge 2: Øvelser#

Opgaverne er håndregningsopgaver med mindre andet er angivet (fx at du bliver bedt om at plotte en graf eller udregne en eksponentialfunktion).

Opgaver – Store Dag#

1: Jacobi-matricer for forskellige funktioner#

Vi definerer funktioner nedenfor af formen \(\pmb{f}: \operatorname{dom}(\pmb{f}) \to \mathbb{R}^k\), hvor \(\operatorname{dom}(\pmb{f}) \subseteq \mathbb{R}^n\) og hvor \(n\) og \(k\) kan aflæses af funktionsforskriften. Vi vil i denne opgave ikke bekymre os om at finde den præcise definitionsmængde \(\operatorname{dom}(\pmb{f})\), men blot nævne at hvis fx \(\ln(x_3)\) indgår i funktionsforeskriften, så må man jo kræve at \(x_3 > 0\).

Spørgsmål a#

Lad \({f}(x_1, x_2, x_3) = x_1^2x_2 + 2x_3\). Beregn Jacobi-matricen \(J_{f}(\pmb{x})\) og evaluer den i punktet \(\pmb{x} = (1, -1, 3)\). Bekræft at Jacobi-matricen for en skalar-funktion af flere variable kun har én række.
Lad \(\pmb{f}(x) = (3x, x^2, \sin(2x))\). Beregn Jacobi-matricen \(J_{\pmb{f}}(x)\) og evaluer den i punktet \(x = 2\). Bekræft at Jacobi-matricen for en vektor-funktion af én variabel kun har én søjle.
Lad \(\pmb{f}(x_1, x_2) = (x_1^2, -3x_2, 12x_1)\). Beregn Jacobi-matricen \(J_{\pmb{f}}(\pmb{x})\) og evaluer den i punktet \(\pmb{x} = (2, 0)\).
Lad \(\pmb{f}(x_1, x_2, x_3) = (x_2 \sin(x_3), 3x_1x_2 \ln(x_3))\). Beregn Jacobi-matricen \(J_{\pmb{f}}(\pmb{x})\) og evaluer den i punktet \(\pmb{x} = (-1, 3, 2)\).
Lad \(\pmb{f}(x_1, x_2, x_3) = (x_1 e^{x_2}, 3x_2 \sin(x_2), -x_1^2 \ln(x_2 + x_3))\). Beregn Jacobi-matricen \(J_{\pmb{f}}(\pmb{x})\) og evaluer den i punktet \(\pmb{x} = (1, 0, 1)\).

Note

Når du skal evaluere Jacobi-matricen, skal du ikke angive decimaltal. Du skal angive den præcise værdi som fx kan indeholde \(\cos(4)\) og \(\ln(2)\).

Spørgsmål b#

Alle funktionerne fra forrige spørgsmål er differentiable. Hvordan kan man argumentere for dette? For hvilke af funktionerne kan vi udregne Hesse-matricen? (eng: the hessian). Udregn Hesse-matricen for de af funktionerne hvor Hesse-matricen er defineret.

Spørgsmål c#

Lad \(\pmb{v} = (1,1,1)\). Normaliser vektoren \(\pmb{v}\) og kald denne \(\pmb{e}\). Tjek at \(||\pmb{e}||=1\). Udregn den retningsafledte af skalar-funktionen \({f}(x_1, x_2, x_3) = x_1^2x_2 + 2x_3\) i punktet \(\pmb{x} = (1, -1, 3)\) i retningen \(\pmb{v}\). Udregn bagefter \(J_f(\pmb{x}) \pmb{e}\). Sammenlign med den retningsafledte. Er de ens? I så fald: er det et tilfælde?

2: Jacobi-matricen for et Neuralt Netværk#

Vi betragter et neuralt netværk \(\Phi: \mathbb{R}^2 \to \mathbb{R}^3\) med ét skjult lag. Netværket sender et input \(\pmb{x}\) til et output \(\pmb{y}\) gennem følgende trin:

Affin transformation (Lag 1): \(\pmb{z} = W_1 \pmb{x} + \pmb{b}_1\). Vi skriver \(T_{W_1,\pmb{b}_1}(\pmb{x}) = W_1 \pmb{x} + \pmb{b}_1\).
Aktivering (ReLU): \(\pmb{h} = \pmb{ReLU}(\pmb{z})\)
Lineær transformation (Output uden aktivering): \(\pmb{y} = W_2 \pmb{h}\). Vi skriver \(L_{W_2}(\pmb{h}) = W_2 \pmb{h}\).

Altså er sidste aktiveringsfunktion identiteten.

Parametrene er givet ved:

\[\begin{split} W_1 = \begin{bmatrix} 1 & -1 \\ 1 & 1 \end{bmatrix}, \quad \pmb{b}_1 = \begin{bmatrix} -1 \\ 0 \end{bmatrix}, \quad W_2 = \begin{bmatrix} 2 & 1 \\ 0 & -2 \\ -1 & 3 \end{bmatrix} \end{split}\]

Vi ønsker at bestemme Jacobi-matricen \(J_{\Phi}(\pmb{x})\).

Spørgsmål a#

Vi betragter først den skalare ReLU-funktion \(\sigma = \text{ReLU}\) fra \(\mathbb{R}\) til \(\mathbb{R}\). Find et udtryk for \(\sigma'(z)\) givet ved en gaffelfunktion. Udtrykket er ikke defineret for \(z=0\). Hvorfor? Find dernæst et udtryk for \(\pmb{J}_{\pmb{\operatorname{ReLU}}}\) for ReLU-vektorfunktionen fra \(\mathbb{R}^2\) til \(\mathbb{R}^2\).

Vi skriver \(\Lambda = \pmb{J}_{\pmb{\operatorname{ReLU}}}\) i resten af opgaven.

Hint

Dit svar må godt indeholde udtryk af formen \(\sigma'(z_i)\). Vi kender jo allerede denne funktion (via gaffeludtrykket).

Spørgsmål b#

Find Jacobi-matricerne for de to funktioner fra hhv trin 1 og 3.

Hint

Du skal finde \(\pmb{J}_{T_{(W_1,\pmb{b}_1)}}\) og \(\pmb{J}_{L_{W_2}}\). Lad os for korthedsskyld benævne dem \(\pmb{J}_{T}\) og \(\pmb{J}_{L}\).

Spørgsmål c#

Benyt kædereglen til at opstille et generelt udtryk for Jacobi-matricen \(J_{\Phi}(\pmb{x})\).

Hint

Udtrykket skal bestå af produktet af de tre Jacobi-matricer \(\pmb{J}_{T}\), \(\pmb{J}_{L}\) og \(\Lambda(\pmb{z})\) i en passende rækkefølge. Tjek den generaliserede kæderegel og tænk over hvad \(\pmb{z}\) er.

Hint

Udtrykket indeholder kun: \(W_2\), \(W_1\) og diagonalmatricen \(\Lambda\).

Spørgsmål d#

Vi betragter nu det specifikke input \(\pmb{x}_0 = \begin{bmatrix} 0 \\ 2 \end{bmatrix}\). Find Jacobi-matricen \(J_{\Phi}(\pmb{x}_0)\).

Hint

Start med at finde \(\pmb{z}\). Hvis en koordinat i \(\pmb{z}\) er positiv, sæt 1 på diagonalen i \(\Lambda\). Hvis negativ, sæt 0. Gang derefter matricerne sammen: \(W_2 \cdot \Lambda \cdot W_1\).

Spørgsmål e#

Vi har nu fundet Jacobi-matricen \(J_{\Phi}(\pmb{x}_0)\). Hvis vi ændrer inputtet \(x_1\) med en lille værdi \(\epsilon\) (dvs. \(\Delta \pmb{x} = [\epsilon, 0]^T\)), hvor meget ændrer output-vektoren \(\pmb{y}\) sig så cirka? Brug din Jacobi-matrix til at svare.

Svar

Jacobi-matricens søjler angiver ændringen i outputtet ved ændring af en specifik input-variabel. Første søjle svarer til \(x_1\).

\[\begin{split} \Delta \pmb{y} \approx J_{\Phi} \cdot \Delta \pmb{x} = \begin{bmatrix} 1 & 1 \\ -2 & -2 \\ 3 & 3 \end{bmatrix} \begin{bmatrix} \epsilon \\ 0 \end{bmatrix} = \begin{bmatrix} \epsilon \\ -2\epsilon \\ 3 \epsilon \end{bmatrix} \end{split}\]

Outputtets første koordinat stiger med \(\epsilon\), og den anden falder med \(2\epsilon\), mens den tredje stiger mest med \(3\epsilon\).

Note

Jacobi-matricen beskriver netværkets følsomhed: Den fortæller præcis, hvor meget og i hvilken retning outputtet ændrer sig, når vi justerer inputtet en smule. Denne indsigt er vigtig i neurale netværk for at forstå, hvilke input-parametre der har størst indflydelse på resultatet.

Spørgsmål f (frivillig)#

Verificerer beregningen symbolsk i Python med SymPy. Du kan bruge dette eksempel som inspiration:

from sympy import symbols, Matrix, Max

x1, x2 = symbols('x1 x2')
x = Matrix([x1, x2])

W1 = Matrix([[1, -1], [2, 1]])
b1 = Matrix([-1, 0])
W2 = Matrix([[2, 1], [0, -3]])

z = W1 * x + b1
h = Matrix([Max(0, z[0]), Max(0, z[1])]) # ReLU(z)

y = W2 * h

J = y.jacobian(x)
J_val = J.subs({x1: 0, x2: 2})

print("Evalueret Jacobi-matrix:")
display(J_val)

Evalueret Jacobi-matrix:

\[\begin{split}\displaystyle \left[\begin{matrix}2 & 1\\-6 & -3\end{matrix}\right]\end{split}\]

3: Beskrivelse af mængder i planen#

Tegn i hvert af de fire nedenstående tilfælde en skitse af den angivne punktmængde \(\,A\,\), det indre \(\,A^{\circ}\,\), randen \(\,\partial A\,\) og afslutningen \(\,\bar{A}\,\). Undersøg endvidere, om \(\,A\,\) er åben, afsluttet eller ingen af delene. Angiv endelig, om \(\,A\,\) er begrænset eller ikke.

\(\{(x,y) \mid xy\neq 0\}\)
\(\{(x,y) \mid 0<x<1 \wedge 1\leq y\leq 3\}\)
\(\{(x,y) \mid y\geq x^2 \wedge y<2 \}\)
\(\{(x,y) \mid x^2+y^2-2x+6y\leq 15 \}\)

Hint

Papir og blyant: Tegn et koordinatsystem for hver mængde og skitsér mængden her i.
Start med simple tilfælde: Er mængden defineret ved fx en ulighed som \(y<2x\), så indtegn som hjælp \(y=2x\). Gør dette for alle uligheder og \(\neq\).
Undersøg grænserne: Bestem om randen er inkluderet eller ekskluderet (kig efter \(<\), \(>\), \(\leq\), \(\geq\)). Hvis randen ikke er inkluderet, bør randen tegnes som en stiplet linje.
Brug akserne som reference: Overvej hvordan mængden relaterer sig til \(x\)- og \(y\)-aksen.

Svar

\(\{(x,y)\,\vert\, xy\neq 0\}\) udgør den reelle talplan (\(\mathbb{R}^2\)), men uden koordinatakserne. Dette område udgør også det indre af mængden, mens randen af mængden udgøres af koordinatakserne. Afslutningen er hele den reelle talplan. Mængden er åben og ikke begrænset.
\(\{(x,y)\,\vert\, 0<x<1\wedge 1\leq y\leq 3\}\) er det rektangel, der er indsluttet af linjerne \(x=0\), \(x=1\), \(y=1\) og \(y=3\), hvor \(x=0\) og \(x=1\) ikke tilhører mængden, mens \(y=1\) og \(y=3\) tilhører mængden. Det indre af mængden er rektanglet eksklusive linjestykkerne, randen er alle fire linjestykker og afslutningen er rektanglet inklusive linjestykkerne. Mængden er hverken åben eller afsluttet, men den er begrænset.
\(\{(x,y)\,\vert\, y\geq x^2 \,\,\,\mathrm{og}\,\,\,y<2 \}\) er fællesmængden af det område som ligger over parablen med ligningen \(\,y=x^2\,\) og det område som ligger under linjen \(\,y=2\,\). Bemærk at parabelstykket fra punktet \(\,(- \sqrt{2},2)\,\) til punktet \(\,( \sqrt{2},2)\,\) pånær endepunkterne er med i mængden, mens linjestykket fra punktet \(\,(- \sqrt{2},2)\,\) til punktet \(\,( \sqrt{2},2)\,\) ikke er med. Det indre af mængden er denne fællesmængde eksklusive parabelstykket fra punktet \(\,(- \sqrt{2},2)\,\) til punktet \(\,( \sqrt{2},2)\,.\) Randen består af dette parabelstykke og linjestykket fra punktet \(\,(- \sqrt{2},2)\,\) til punktet \(\,( \sqrt{2},2)\,.\) Endelig er afslutningen området inklusive linjestykket og parabelstykket. Den givne mængde er hverken åben eller afsluttet, mens den er begrænset.
\(\{(x,y)\,\vert\, x^2+y^2-2x+6y\leq 15 \}\) udgør området indenfor cirklen med centrum i \((1,-3)\) og radius 5. Det indre er området eksklusive cirkelperiferien, randen er cirkelperiferien og afslutningen er området inklusive cirkelperiferien. Afslutningen er altså mængden selv. Mængden er afsluttet og begrænset.

4: Alle lineære afbildninger fra \(\mathbb{R^n}\) til \(\mathbb{R}\)#

Lad \(L: \mathbb{R}^n \to \mathbb{R}\) være en (vilkårlig) lineær afbildning. Lad \(e = \pmb{e}_1, \pmb{e}_2, \dots, \pmb{e}_n\) være standard-basen for \(\mathbb{R}^n\), og lad \(\beta\) være standard-basen for \(\mathbb{R}\). Husk standard basen fra Matematik 1a. Bemærk da dimensionen af \(\mathbb{R}\) (over \(\mathbb{R}\)) er en, er standard-basen for \(\mathbb{R}\) blot tallet \(1\).

Vis at der eksisterer en søjlevektor \(\pmb{c} \in \mathbb{R}^n\) således at

\[\begin{equation*} L(\pmb{x}) = \pmb{c}^T \pmb{x} = \langle \pmb{x}, \pmb{c} \rangle \end{equation*}\]

hvor \(\langle \cdot, \cdot \rangle\) angiver det sædvanlige indreprodukt på \(\mathbb{R}^n\). (Søjlevektoren er entydigt givet, men det er ikke en del af opgaven at argumentere for dette).

Hint

Hvad er afbildningsmatricen \({}_\beta[L]_e\) for \(L\) m.h.t. de to baser?

Svar

\(\pmb{c}^T = {}_\beta[L]_e = [L(\pmb{e}_1), L(\pmb{e}_2), \dots, L(\pmb{e}_n)]\)

5: Linæere(?) vektor funktioner#

Vi betragter følgende to funktioner:

\(f: \mathbb{R}^{2 \times 2} \to \mathbb{R}^{2 \times 2}, f(X) = C X B\), hvor \(C = \operatorname{diag}(2,1) \in \mathbb{R}^{2 \times 2}\) og \(B = \begin{bmatrix} 1 & 1 \\ 0 & 1 \end{bmatrix}\).
\(g: \mathbb{R}^n \to \mathbb{R}, g(\pmb{x}) = \pmb{x}^T A \pmb{x}\), hvor \(A\) er en \(n \times n\) matrix (og ikke nulmatricen).

Afgør for hver funktion om den er en lineær afbildning. Hvis afbildningen er lineær, find afbildningsmatricen med hensyn til, henholdsvis:

standard-basen \(E=\begin{bmatrix} 1 & 0 \\ 0 & 0 \end{bmatrix}, \begin{bmatrix} 0 & 1 \\ 0 & 0 \end{bmatrix}, \begin{bmatrix} 0 & 0 \\ 1 & 0 \end{bmatrix}, \begin{bmatrix} 0 & 0 \\ 0 & 1 \end{bmatrix}\) i \(\mathbb{R}^{2 \times 2}\). Husk dette eksempel fra Mat1a
standard-basen \(e\) i \(\mathbb{R}^n\). Husk dette result fra Mat1a

6: Den simple kæderegel#

I denne opgave skal vi arbejde med den simple kæderegel givet her.

Vi betragter først en reel funktion af to reelle variable givet ved forskriften

\[\begin{equation*} g(x,y)=\ln(9-x^2-y^2). \end{equation*}\]

Spørgsmål a#

Bestem den størst mulige definitionsmængde for \(g\), og karakterisér den ved hjælp af begreber som åben, afsluttet, begrænset, ubegrænset.

Svar

Logaritmen kan kun tages af positive værdier, derfor må vi kræve

\[\begin{equation*} 9-x^2-y^2>0. \end{equation*}\]

Men dette kan omskrives til \(x^2+y^2<3^2\), altså er \(\operatorname{dom}(g)=\{(x,y)\,|\,x^2+y^2<3^2\}\). Det er en cirkelskive med centrum i Origo og radius 3, men hvor periferien ikke er med. Mængden er åben og begrænset.

Vi betragter nu en parametriseret kurve \(\pmb{r}\) i \((x,y)\)-planen givet ved

\[\begin{equation*} \pmb{r}(u)=(u,u^3)\,,\,u\in \left[-1.2\,,\,1.2\right]. \end{equation*}\]

Spørgsmål b#

Hvilken kurve er der tale om (du er bekendt med dens ligning)?

Svar

Det er grafen for tredjegradspolynomiet \(p(x)=x^3\,,\,\,x\in \left[-1.2\,,\,1.2\right]\).

Vi betragter nu den sammensatte funktion

\[\begin{equation*} h(u) = g(\pmb{r}(u)). \end{equation*}\]

Spørgsmål c#

Hvad er definitionsmændgen og dispositionsmængden for \(h = g \circ \pmb{r}\)?

Svar

\(\operatorname{dom}(h) = \left[-1.2\,,\,1.2\right]\) og \(\operatorname{co-dom}(h) = \mathbb{R}\).

Spørgsmål d#

Bestem \(h'(1)\) ved to forskellige metoder:

Bestem et funktionsudtryk for \(h(u)\) og differentiér på sædvanlig vis.
Benyt Kædereglen i Afsnit 3.7.

Svar

Vi får \(h(u)=\ln(-u^6-u^2+9)\,\) og \(h'(1)=-\frac{8}{7}\).
Tangentvektoren bestemmes: Da \(\pmb{r}'(u)=(1,3\,u^2)\) fås \(\pmb{r}'(1)=(1,3)\). Gradienten af \(\nabla f(x,y)\) findes. Herefter kan \(\nabla f(\pmb{r}(1))=\nabla f(1,1)=(-\frac{2}{7},-\frac{2}{7})\) udregnes. Det indre produkt (prikproduktet) af de to fundne vektorer er \(-\frac{8}{7}\).

7: Den generaliserede kæderegel#

I denne opgave skal vi bruge denne sætning: Generalized chain rule

Givet funktionerne:

\(\pmb{f} : \mathbb{R}^3 \to \mathbb{R}^2\) defineret ved \(\pmb{f}(x_1, x_2, x_3) = (f_1(x_1, x_2, x_3), f_2(x_1, x_2, x_3))\), hvor \(f_1(x_1, x_2, x_3) = x_1^2 + x_2^2 + x_3^2\) og \(f_2(x_1, x_2, x_3) = e^{x_1 + x_2} \, \cos(x_3)\).
\(g : \mathbb{R}^2 \to \mathbb{R}\) defineret ved \(g(y_1, y_2) = y_1 \, \sin(y_2)\).
Sammensætning af disse funktioner: \(h = g \circ \pmb{f}\).

Vi vil i opgaven beregne Jacobi-matricen af \(h\) (med hensyn til de variable \(x_1, x_2,\) og \(x_3\)) ved brug af den generaliserede kæderegel. Du må gerne lave udregningerne i SymPy.

Spørgsmål a#

Find funktionsudtrykket for \(h\) samt definitionsmængden og dispositionsmængden. Udregn gradienten af \(h\).

Spørgsmål b#

Beregn Jacobi-matricen for \(\pmb{f}\). Beregn Jacobi-matricen for \(g\). Hvad er sammenhængen mellem gradienten og Jacobi-matricen for \(g\)?

Hint

For skalære funktioner er Jacobi-matricen en rækkevektor: nemlig den transponerede (søjle)-gradientvektor.

Spørgsmål c#

Anvend nu kædereglen og Jacobi-matricerne fra forrige opgave til at finde Jacobi-matricen af \(h\). Sammenlign med svaret i Spørgsmål a.

Hint

Din anvendelse af den generaliserede kæderegel skal involvere et matrix-matrix produkt af \(1 \times 2\) og \(2 \times 3\) matricer.

Hint

Husk at du skal evaluere Jacobi-matricen/gradienten for \(g\) i det rigtige punkt, nemlig i \((y_1,y_2) = \pmb{f}(x_1, x_2, x_3)\). Dette er helt ligesom den kendte kæderegel fra gymnasiet, hvor \(g(f(x))' = g'(f(x)) f'(x)\) hvor \(g'\) på højresiden evalueres i \(f(x)\).

8: Partielle afledede men ikke differentiabel#

Vi starter med en simpel funktion \(f\), der er differentiabel overalt. Lad \(f:\mathbb{R}^2 \to \mathbb{R}\) være givet ved

\[\begin{equation*} f(x_1,x_2)=x_1^2-4x_1+x_2^2. \end{equation*}\]

Spørgsmål a#

Lad \(\pmb{x}_0 = (x_1,x_2) \in \mathbb{R}^2\) være et vilkårligt punkt. Gør rede for at \(f\) er differentiabel i \(\pmb{x}_0\) og bestem gradienten af \(f\) i \(\pmb{x}_0\).

Soft version: Benyt resultatet i denne sætning

Hard version: Løs opgaven direkte fra definitionen på differentiabilitet i afsnit 3.6. Vi følger denne fremgangsmåde i hints og svar nedenfor:

Hint

I lighed med arbejdet i gymnasiet skal vi betragte sammenhængen mellem \(\Delta f = f(\pmb{x}_0+\pmb{h}) - f(\pmb{x}_0)\) og \(\pmb{h}\) i forbindelse med grænseovergangen \(\pmb{h}\longrightarrow\pmb{0}\), men bemærk, at \(\pmb{h}\) nu er en vektor.

Hint

Sæt \(\pmb{h}=(h_1,h_2)\). Udregn \(\Delta f\).

Hint

\(\Delta f=f(x_1+h_1,x_2+h_2)-f(x_1,x_2)\).

Hint

\[\begin{equation*} \Delta f = f(x_1+h_1,x_2+h_2)-f(x_1,x_2) = (x_1+h_1)^2-4(x_1+h_1)+(x_2+h_2)^2-f(x_1,x_2) \end{equation*}\]

Svar

\[\begin{align*} \Delta f &= f(x_1+h_1,x_2+h_2)-f(x_1,x_2) \\ &= (x_1+h_1)^2 - 4(x_1+h_1) + (x_2+h_2)^2 - \bigl[x_1^2 - 4x_1 + x_2^2\bigr] \\ &= 2x_1\cdot h_1+2x_2\cdot h_2-4h_1+h_1^2+h_2^2 \\ &= \begin{bmatrix} 2x_1-4 & 2x_2 \end{bmatrix} \begin{bmatrix} h_1 \\ h_2 \end{bmatrix}+h_1^2+h_2^2 \\ &= \begin{bmatrix} 2x_1-4 \\ 2x_2 \end{bmatrix}^T \, \pmb{h}+|| \pmb{h}||^2. \end{align*}\]

Da \(\varepsilon (\pmb{h}) = ||\pmb{h}||\) er en epsilonfunktion, kan vi samlet skrive dette som:

\[\begin{equation*} f(\pmb{x}_0+\pmb{h}) - f(\pmb{x}_0) = \pmb{c}^T \pmb{h}+\varepsilon (\pmb{h}) \, ||\pmb{h}||. \end{equation*}\]

hvor \(\pmb{c} =\begin{bmatrix} 2x_1-4 \\ 2x_2 \end{bmatrix}\).

Vi konkluderer at \(f\) er differentiabel i henhold til definitionen, og der gælder

\[\begin{equation*} \nabla f(x_1,x_2)= \pmb{c} = (f_{x_1}'(x_1,x_2),f_{x_2}'(x_1,x_2))=(2x_1-4,2 x_2). \end{equation*}\]

Spørgsmål b#

For at konkludere differentiabilitet fra de partielle afledede, jvf. denne sætning, kræves at de partielle afledede er kontinuerte. Hvorfor er det ikke nok at de partielle afledede eksisterer? Det skal vi undersøge gennem et konkret eksempel. Men først generaliserer vi en (fra gymnasiet) velkendt sætning om en funktion af én variabel: Hvis den er differentiabel i et punkt, så er den også kontinuert i det punkt.

Vis at hvis en funktion af to variable er differentiabel i et punkt \(\pmb{x}_0\), så er den også kontinuert i det punkt.

Hint

De to definitioner kan bruges direkte (evt. kan man finde beviset i bogen).

Og nu til eksemplet, der har navngivet opgaven. Vi betragter funktionen

\[\begin{equation*} g(x_1,x_2) = \begin{cases} \frac{x_1^2x_2}{x_1^4+x_2^2}, & \text{for } (x_1,x_2) \neq (0,0) \\ 0, & \text{for } (x_1,x_2)=(0,0) \end{cases} \end{equation*}\]

Spørgsmål c#

Vis at de partielle afledede af \(g\) eksisterer i \((0,0)\), men at \(g\) ikke er differentiabel i dette punkt.

Hint

Første del af spørgsmålet burde ikke være så svært: De to hjælpefunktioner \(h_{x_2}(x_1)\) og \(h_{x_1}(x_2)\) er nemlig konstante på hele \(\,x_1\)-aksen henholdsvis hele \(x_2\)-aksen. OK?

Hint

Anden del af spørgsmålet: Vi så at hvis funktionen er differentiabel i et punkt, så er den også kontinuert i punktet. Men så må der omvendt gælde at hvis funktionen ikke er kontinuert i punktet, kan den heller ikke være differentiabel i punktet. Så vi skal bare vise at \(g\) ikke er kontinuert i \((0,0)!\)

Hint

Ud fra forskriften er \(g(0,0)=0\). Men hvad går restriktionen af \(g\) til parabelbuen \(x_2=x_1^2\) imod når \(x_1\) går mod \(0\)?

Svar

Den går mod \(\frac{1}{2}\). Og så er \(g\) jo ikke kontinuert i \((0,0)\). Tænk gerne hele argumentet igennem igen.

9: Niveaukurver og retningsafledte for skalar-funktioner#

En funktion \(f:\mathbb{R}^2\rightarrow\mathbb{R}\) er givet ved forskriften

\[\begin{equation*} f(x,y)=x^2+y^2. \end{equation*}\]

Og en anden funktion \(g:\mathbb{R}^2\rightarrow\mathbb{R}\) er givet ved forskriften

\[\begin{equation*} g(x,y)=x^2-4x+y^2. \end{equation*}\]

Spørgsmål a#

Beskriv niveaukurverne givet ved \(f(x,y)=c\) for værdierne \(c\in\{1,2,3,4,5\}\).

Hint

Husk cirklens ligning: \((x-a)^2+(y-b)^2=r^2\).

Svar

Niveaukurverne er cirkler, der alle har centrum i \((0,0)\). Deres radier er henholdsvis \(1,\,\sqrt 2,\,\sqrt 3,\,2,\,\sqrt{5}\,\).

Spørgsmål b#

Bestem gradienten af \(f\) i punktet \((1,1)\) og bestem den retningsafledede af \(f\) i punktet \((1,1)\) i den retning der er bestemt af enhedsretningsvektoren \(\pmb{e}=(1,0)\).

Svar

\(\nabla f(1,1)=(2,2)\). Den retningsafledede er det indre produkt (prikproduktet) af gradienten og den givne retningsvektor:

\[\begin{equation*} \nabla_{\pmb{e}}\, f(1,1) = \langle \pmb{e}, \nabla f(1,1) \rangle = 1 \cdot 2 + 0 \cdot 2 = 2. \end{equation*}\]

Spørgsmål c#

Beskriv niveaukurverne givet ved \(g(x,y)=c\) for værdierne \(c \in\{-3,-2,-1,0,1\}\).

Hint

Husk cirklens ligning: \((x-a)^2+(y-b)^2=r^2\).

Svar

Vi giver resultatet for den første: Idet

\[\begin{equation*} x^2-4x+y^2=-3\Leftrightarrow (x-2)^2+y^2=1 \end{equation*}\]

er niveaukurven en cirkel med centrum i \((2,0)\) og radius 1. De andre niveaukurver er også cirkler med det samme centrum, men forskellige radier.

Spørgsmål d#

Bestem gradienten af \(g\) i punktet \((1,2)\) og bestem den retningsafledede af \(g\) i punktet \((1,2)\) i retningen mod Origo \((0,0)\).

Svar

Vi starter med gradienten:

\[\begin{equation*} \nabla g(1,2)=(-2,4). \end{equation*}\]

Hint

Vi skal nu bruge en enhedsvektor (unit vector) der peger fra \((1,2)\) mod Origo.

Hint

Vi kan bruge retningsvektoren \((-1,-2)\) men den skal normeres det vil sige have længden/normen 1.

Svar

Den ønskede enhedsvektor fås ved at dividere den foreslåede retningsvektor med dens norm, det vil sige:

\[\begin{equation*} \pmb{v}:=\left(-\frac{1}{\sqrt 5},-\frac{2}{\sqrt 5}\right). \end{equation*}\]

Når vi derefter udregner det indre produkt af \(\pmb{v}\) og gradienten \(\nabla g(1,2)\), får vi den retningsafledede

\[\begin{equation*} \nabla_{(-1,-2)} \, g(1,2) = \nabla_{\pmb{v}} \, g(1,2) = \langle \pmb{v}, \nabla g(1,2) \rangle = -\frac{6}{\sqrt{5}}. \end{equation*}\]

10: Gradientvektorfelter og hesse-matricen#

Spørgsmål a#

Gradient-vektoren for \(f(x_1, x_2) = x_1^2 \sin(x_2)\) er \(\nabla f(\pmb{x})=(2x_1 \sin(x_2),x_1^2 \cos(x_2))\). Gradientvektoren kan derfor opfattes som en afbildning \(\nabla f : \operatorname{dom}(f) \to \mathbb{R}^2\). Nedskriv afbildningen som funktion (hvor du angiver \(\operatorname{dom}(f)\)) og plot den som et vektorfelt.

Spørgsmål b#

Udregn nu Jacobi-matricen \(\pmb{J}_{\nabla f}(x_1,x_2)\) af \(\nabla f : \mathbb{R}^2 \to \mathbb{R}^2\) i punktet \((x_1,x_2)\).

Spørgsmål c#

Udregn hesse-matricen \(\pmb{H}_{f}(x_1,x_2)\) for \(f : \mathbb{R}^2 \to \mathbb{R}\) i punktet \((x_1,x_2)\) og sammenlign med svaret i forrige opgave.

Temaøvelse – Lille Dag#

Der er tema-øvelse Tema 1: Gradientmetoden

Uge 2: Øvelser

Contents

Uge 2: Øvelser#

Opgaver – Store Dag#

1: Jacobi-matricer for forskellige funktioner#

Spørgsmål a#

Spørgsmål b#

Spørgsmål c#

2: Jacobi-matricen for et Neuralt Netværk#

Spørgsmål a#

Spørgsmål b#

Spørgsmål c#

Spørgsmål d#

Spørgsmål e#

Spørgsmål f (frivillig)#

3: Beskrivelse af mængder i planen#

4: Alle lineære afbildninger fra \(\mathbb{R^n}\) til \(\mathbb{R}\)#

5: Linæere(?) vektor funktioner#

6: Den simple kæderegel#

Spørgsmål a#

Spørgsmål b#

Spørgsmål c#

Spørgsmål d#

7: Den generaliserede kæderegel#

Spørgsmål a#

Spørgsmål b#

Spørgsmål c#

8: Partielle afledede men ikke differentiabel#

Spørgsmål a#

Spørgsmål b#

Spørgsmål c#

9: Niveaukurver og retningsafledte for skalar-funktioner#

Spørgsmål a#

Spørgsmål b#

Spørgsmål c#

Spørgsmål d#

10: Gradientvektorfelter og hesse-matricen#

Spørgsmål a#

Spørgsmål b#

Spørgsmål c#

Temaøvelse – Lille Dag#