Leray-Schauderの不動点定理について

こんにちは。ひよこてんぷらです。今回はまた不動点定理をやります。

 

前回はSchauderの不動点定理をやりました。

 

sushitemple.hatenablog.jp

 

これは、norm空間 X とその空でない凸部分集合 \Omega \subset X およびcompactな部分集合 K \subset \Omega を考えるとき、任意の f \in C(\Omega:K) に対して f(x)=x なる x \in \Omega が存在する、という不動点定理のことでした。

 

この不動点定理からさらにLeray-Schauderの不動点定理を示すことができます。今回はこれをやります。

 

さて、まずはcompactな写像の定義を与えます。

 

集合 X,Y に対する写像 f \in C(X:Y) がcompactであるとは、任意の有界集合 \Omega \subset X に対して \overline{f(\Omega)} がcompactとなることと定義します。ここでcompactとは、 Y でcompactということです。もちろん、 \overline{f(\Omega)} \subset Y となります。 

 

この定義を用いて、Leray-Schauderの不動点定理の主張を述べます。

 

X をBanach空間とします。ここで、写像 f \in C(X \times [0,1]:X) はcompactであり、かつ任意の x \in X に対して f(x,0)=0 とします。さらに、次を満たすとします。

 

ある M \gt 0 が存在して、 x=f(x,\lambda) を満たすような任意の  (x,\lambda) \in X \times [0,1] に対して \|x\|_X \lt M が成立する

 

このとき、 f(\cdot,1)不動点を持ちます。すなわち、 f(x,1)=x なる x \in X が存在します。

 

これがLeray-Schauderの不動点定理です。写像に関する仮定は強いですが、凸集合でなくても主張が成立します。これを示すために、次のステップに分けて考えましょう。

 

(i) 有界な凸閉集合 \Omega \subset X に対して f \in C(\Omega:\Omega) がcompactであれば、 f不動点を持つ

(ii) B = \{y \in X \mid \|y\|_X \lt 1\} に対して、 f \in C(\overline{B}:X) かつ \overline{f(\overline{B})} はcompactかつ f(\partial B) \subset B ならば、 f不動点を持つ

(iii) Leray-Schauderの不動点定理が成立する

 

では早速(i)から見ていきます。(i)に関してはSchauderの不動点定理から容易に示されます。実際、 \Omega \subset X有界な凸閉集合ですから、写像のcompact性から \overline{f(\Omega)} がcompactになることより、写像 ff \in C(\Omega:\overline{f(\Omega)}) とみることで、Schauderの不動点定理が使えます。したがって不動点の存在が示されます。

 

次に(ii)を示しましょう。さて、 f \in C(\overline{B}:X) に対して f^*

\begin{equation} f^*(x) =\left\{\begin{array}{cc} f(x) & \text{if} \quad \|f(x)\|_X \le 1 \\ f(x)/\|f(x)\|_X & \text{if} \quad \|f(x)\|_X \gt 1 \end{array}\right. \end{equation}

と定義すると、 f^* \in C(\overline{B}:\overline{B}) となります。実際、 x \in \overline{B} に対して \|f(x)\|_X \le 1 ならば

\begin{equation} \|f^*(x)\|_X =\|f(x)\|_X \le 1 \end{equation}

また \|f(x)\|_X \gt 1 ならば

\begin{equation} \|f^*(x)\|_X =\left\|\frac{f(x)}{\|f(x)\|_X}\right\|_X = \frac{\|f(x)\|_X}{\|f(x)\|_X}=1 \end{equation}

より常に \|f^*(x)\|_X \le 1 であり、したがってこれは f^*(x) \in \overline{B} を意味します。

 

次に連続性について、これは f \in C(\overline{B}:X) およびnormの連続性から分かります。念のため \|f(x)\|_X=1 周りでの連続性をチェックしておきましょう。 \|f(x_0)\|_X=1 なる  x_0 \in \overline{B} に対して

\begin{equation} \|f^*(x)-f^*(x_0)\|_X=\|f^*(x)-f(x_0)\|_X \end{equation}

が成立するわけですが、もし \|f(x)\|_X \le 1 ならば

\begin{equation} \|f^*(x)-f^*(x_0)\|_X=\|f(x)-f(x_0)\|_X \end{equation}

より f \in C(\overline{B}:X) から連続であることが分かります。一方 \|f(x)\|_X \gt 1 ならば

\begin{equation}\begin{split} \|f^*(x)-f^*(x_0)\|_X &=\left\| \frac{f(x)}{\|f(x)\|_X}-f(x_0) \right\|_X \\ &=\left\| \frac{f(x)-\|f(x)\|_Xf(x_0)}{\|f(x)\|_X} \right\|_X \\ &=\frac{\|f(x)-\|f(x)\|_Xf(x_0)\|_X}{\|f(x)\|_X} \\ &\lt \|f(x)-\|f(x)\|_Xf(x_0)\|_X \end{split}\end{equation}

となります。さて、いま \|f(x_0)\|_X=1 であるから、

\begin{equation}\begin{split} &\|f(x)-\|f(x)\|_Xf(x_0)\|_X \\ &=\|f(x)-f(x_0)+f(x_0)-\|f(x)\|_Xf(x_0)\|_X \\ &\le \|f(x)-f(x_0)\|_X+\left\| f(x_0)\left\{ 1-\|f(x)\|_X \right\}\right\| \\ &=\|f(x)-f(x_0)\|_X+\|f(x_0)\|_X\left| 1-\|f(x)\|_X \right| \\ &= \|f(x)-f(x_0)\|_X+\left| \|f(x_0)\|_X-\|f(x)\|_X \right| \\ &\le \|f(x)-f(x_0)\|_X+\|f(x_0)-f(x)\|_X \end{split}\end{equation}

よりこの場合でも連続であることが分かります。したがって \|f(x)\|_X=1 周りでも連続で、 f^* \in C(\overline{B}:\overline{B}) を得ます。また、仮定から \overline{f(\overline{B})} はcompactなので、 \overline{f^*(\overline{B})} もcompactです。

 

ここで、(i)を使います。すなわち、有界な凸閉集合 \overline{B} \subset X に対して f^* \in C(\overline{B}:\overline{B}) であるから、不動点の存在がいえます。したがって f^*(x)=x なる x \in \overline{B} が存在します。

 

最後に、これが不動点であることを示します。まず、  x \in B であるとします。このとき \|f^*(x)\|_X=\|x\|_X \lt 1 となります。いま、 \|f(x)\|_X \gt 1 であるとすると、 f^* の定義から、 \|f^*(x)\|_X=1 を得ますがこれは矛盾です。すなわち \|f(x)\|_X \le 1 で、再び f^* の定義から x=f^*(x)=f(x)不動点であることが分かります。一方で、 x \in \partial B であるとすると、仮定から f(\partial B) \subset B ですから f(x) \in B すなわち \|f(x)\|_X \lt 1 で、やはり先と同じ結論を得ます。ゆえに(ii)が示されました。

 

最後に、Leray-Schauderの不動点定理を示しましょう。まずは初めの仮定である

 

ある M \gt 0 が存在して、 x=f(x,\lambda) を満たすような任意の  (x,\lambda) \in X \times [0,1] に対して \|x\|_X \lt M が成立する

 

という条件を M=1 に正規化します。このためには、 f に対して g

\begin{equation} g(x,\lambda)=\frac{1}{M}f(Mx,\lambda) \end{equation}

と定義すればよいです。実際、  (x,\lambda) \in X \times [0,1]x=g(x,\lambda) を満たすとき、 g の定義から

\begin{equation} x=\frac{1}{M}f(Mx,\lambda) \end{equation}

すなわち Mx=f(Mx,\lambda) を得ます。このとき上の仮定から \|Mx\|_X \lt M すなわち \|x\|_X \lt 1 を得ます。また、仮定より写像 f \in C(X \times [0,1]:X) はcompactですが、 g も同様の性質を持ちます。また、 f(x,0)=0 より

\begin{equation} g(x,0)=\frac{1}{M}f(Mx,0)=0 \end{equation}

に注意します。

 

さて、まずは g不動点を求めましょう。任意の正の整数 k および x \in \overline{B} に対して

\begin{equation} g_k^*(x)=\left\{\begin{array}{cl} g\left(\frac{x}{\|x\|_X},k(1-\|x\|_X)\right) & \text{if} \quad 1-\frac{1}{k} \le \|x\|_X \le 1 \\ g\left( \frac{kx}{k - 1},1 \right) & \text{if} \quad \|x\|_X \lt 1-\frac{1}{k} \end{array}\right. \end{equation}

と定義します。このとき、 g_k^* \in C(\overline{B}:X) が成立します。 g \in C(X \times [0,1]:X) なのでnormの連続性と合わせれば連続性はいえそうです。念のため \|x\|_X = 1-\frac{1}{k} 周りでの連続性を確かめましょう。 \|x_0\|_X = 1-\frac{1}{k} なる x_0 \in \overline{B} に対して

\begin{equation}\begin{split} \|g_k^*(x)-g_k^*(x_0)\|_X &=\left\| g_k^*(x)-g\left(\frac{x_0}{\|x_0\|_X},k(1-\|x_0\|_X)\right) \right\|_X \\ &=\left\| g_k^*(x)-g\left(\frac{kx_0}{k - 1},1\right) \right\|_X \end{split}\end{equation}

が成立します。このことから、 g_k^* の定義に注意すれば、 1-\frac{1}{k} \le \|x\|_X \le 1 ならば上の式、 \|x\|_X \lt 1-\frac{1}{k} ならば下の式からそれぞれ連続性が確認できます。ゆえに g_k^* \in C(\overline{B}:X) です。

 

さて、ここで g \in C(X \times [0,1]:X) はcompactだったから、特に \overline{g_k^*(\overline{B})} はcompactであることが分かります。さらに、 g_k^*(\partial B)=\{0\} です。実際、 x \in \partial B ならば \|x\|_X=1 ですが、このとき g(x,0)=0 に注意して、

\begin{equation} \left.g_k^*(x)\right|_{\|x\|_X=1}=\left.g\left(\frac{x}{\|x\|_X},k(1-\|x\|_X)\right)\right|_{\|x\|_X=1}=g(x,0)=0 \end{equation}

を得ます。したがって g_k^*(\partial B)=\{0\} \subset B です。

 

さて、このとき g_k^* は(ii)の仮定を満たしています。すなわち、 g_k^* \in C(\overline{B}:X) かつ \overline{g_k^*(\overline{B})} はcompactかつ g_k^*(\partial B) \subset B です。したがって不動点が存在します。いま関数列 \{g_k^*\} を考えていることに注意して、対応する不動点x_k \in \overline{B} とし、 g_k^*(x_k)=x_k としておきます。ここで、この x_k に対して

\begin{equation} s_k=\left\{\begin{array}{cl} k(1-\|x_k\|_X) & \text{if} \quad 1-\frac{1}{k} \le \|x_k\|_X \le 1 \\ 1 & \text{if} \quad \|x_k\|_X \lt 1-\frac{1}{k} \end{array}\right. \end{equation}

とおくと、 0 \le s_k \le 1 であり、したがって点列 \{(x_k,s_k)\} \subset \overline{B} \times [0,1] が得られます。さて、 \overline{B} \times [0,1] はcompactですから、適当な部分列 \{(x_{k_j},s_{k_j})\} \subset \overline{B} \times [0,1] を選べば収束します。この極限を (x,s) \in \overline{B} \times [0,1] と書きます。

 

さて、このとき実は s=1 が成立しています。実際、もし s \lt 1 であったとすると、 s_{k_j} の定義から十分大きな j に対しては常に

\begin{equation} 1-\frac{1}{k_j} \le \|x_{k_j}\|_X \le 1 \end{equation}

が成立します。このとき g_{k_j}^* は定義から

\begin{equation} x_{k_j}=g_{k_j}^*(x_{k_j})=g\left(\frac{x_{k_j}}{\|x_{k_j}\|_X},k_j(1-\|x_{k_j}\|_X)\right)=g\left(\frac{x_{k_j}}{\|x_{k_j}\|_X},s_{k_j}\right)  \end{equation}

を満たしていますが、 j \to \infty とすれば \|x_{k_j}-x\|_X \to 0 であり、上の評価から \|x\|_X=1 を得ます。したがって g \in C(X \times [0,1]:X) から x=g(x,s) の成立が分かります。ところが、初めの仮定から、 x=g(x,s) が成立するならば常に \|x\|_X \lt 1 を満たさなければならないので、これは矛盾です。ゆえに s=1 となります。

 

したがって、再び s_{k_j} の定義から、十分大きな j に対して常に

\begin{equation} \|x_{k_j}\|_X \lt 1-\frac{1}{k_j} \end{equation}

が成立し、 g_{k_j}^* は定義から

\begin{equation} x_{k_j}=g_{k_j}^*(x_{k_j})=g\left( \frac{k_jx_{k_j}}{k_j - 1},1 \right) \end{equation}

となります。再び g \in C(X \times [0,1]:X) に注意して j \to \infty とすれば x=g(x,1) を得ます。これが不動点になります。

 

さて、後は

\begin{equation} g(x,\lambda)=\frac{1}{M}f(Mx,\lambda) \end{equation}

であったから、

\begin{equation} f(Mx,1)=Mg(x,1)=Mx \end{equation}

となり Mx が求める不動点になります。

 

以上がLeray-Schauderの不動点定理です!!Schauderの不動点に基づいているので、そこまで証明は難しくないと思います。なお証明はGilbarg-Trudingerの「Elliptic Partial Differential Equations of Second Order」にあったものを参考にしました。

 

ちなみに、この定理においては写像f(x,\lambda) として考えたわけですが、この特別な例として f(x,\lambda)=\lambda f(x) を考えることができます。これをLeray-Schauderの不動点定理という場合もあります。そのように書き換えると、次のような主張になります。

 

X をBanach空間とします。ここで、写像 f \in C(X:X) はcompactであり、かつ次を満たすとします。

 

ある M \gt 0 が存在して、 x=\lambda f(x) を満たすような任意の  (x,\lambda) \in X \times [0,1] に対して \|x\|_X \lt M が成立する

 

このとき、 f不動点を持ちます。すなわち、 f(x)=x なる x \in X が存在します。

 

これで今回の記事はおしまいです。見てくださってありがとうございます。

Schauderの不動点定理について

こんにちは。ひよこてんぷらです。今回はSchauderの不動点定理を示します。証明にはBrouwerの不動点定理を用います。

 

Brouwerの不動点定理は、有界な凸集合 \Omega \subset \mathbb{R}^n に対して f \in C(\Omega:\Omega) ならば f(x)=x なる  x \in \Omega が存在する(一意的とは限らない)という定理です。これに関しては、前回の記事を参照してください。

 

sushitemple.hatenablog.jp

 

さて、ではSchauderの不動点定理を示しましょう。まず、凸包の定義を与えます。集合 \Omega に対して、その凸包 \mathrm{Conv} \, \Omega を、 \Omega を含む最小の凸集合と定義します。ここで、 \Omega が有限個の点列の集まりの場合、すなわち \Omega=\{\xi_j\}_{j=1}^m と表すことができる場合、

\begin{equation} \mathrm{Conv} \, \Omega=\mathrm{Conv} \, \{\xi_j\}_{j=1}^m =\left\{ \left. \sum_{j=1}^m \alpha_j\xi_j \, \right| \, \alpha_j \ge 0 \quad \mathrm{and} \quad \sum_{j=1}^m \alpha_j=1 \right\} \end{equation}

が成立します。

 

Schauderの不動点定理は、 X をnorm空間とし、  \Omega \subset X を空でない凸集合、 K \subset \Omega をcompactとするとき、次が成立するという定理です。

(i) 任意の \varepsilon \gt 0 に対して、ある有限個の点列  \{\xi_j^{(\varepsilon)}\}=\{\xi_j^{(\varepsilon)}\}_{j=1}^{m_{\varepsilon}} \subset K写像  P_{\varepsilon} \in C(K: \mathrm{Conv} \, \{\xi_j^{(\varepsilon)}\} ) が存在して、任意の x \in K に対して  \|P_{\varepsilon}x-x\|_X \lt\varepsilon が成立する

(ii) 任意の f \in C(\Omega:K) に対して f(x)=x なる x \in \Omega が存在する

 

(i)の P_{\varepsilon} はSchauder射影作用素と呼ばれ、不動点定理を示すために重要なアイテムです。なお、(ii)が不動点定理の主張ですね。ここで、Brouwerの不動点定理は \Omega \subset \mathbb{R}^n に対する不動点定理だったので有限次元上での定理ですが、Schauderの不動点定理はnorm空間で示せるので無限次元上での不動点の存在です。関数解析の基本は無限次元空間上の議論ですから、無限次元においても不動点が言えるのは嬉しいことです。

 

なお、Schauderの不動点定理として、仮定は \Omega を凸集合としていますが、 \Omega 自身がcompactな凸集合ならば、 K=\Omega とでき、したがって f \in C(\Omega:\Omega) に対して不動点の存在が言えます。こちらをSchauderの不動点定理とすることもあります。

 

では早速主張を示していきましょう。まず(i)を示します。 \varepsilon \gt 0 をとり、開球

\begin{equation} B\left(x,\frac{1}{2}\varepsilon\right) = \left\{ y \in X \, \left| \, \|y-x\|_X \lt \frac{1}{2}\varepsilon \right.\right\} \end{equation}

を考えます。次の開被覆

\begin{equation} K \subset \bigcup_{x \in K} B\left(x,\frac{1}{2}\varepsilon\right) \end{equation}

に対して、 K がcompactであることから、有限個の解被覆で

\begin{equation} K \subset \bigcup_{j=1}^{m_{\varepsilon}} B\left(\xi_j^{(\varepsilon)},\frac{1}{2}\varepsilon\right) \end{equation}

とできます。

 

さて、ここで 1 \le j \le m_{\varepsilon} , \, x \in K に対して次の関数

\begin{equation} \mu_j(x)=\max\left\{ 1-\frac{2}{\varepsilon}\|x-\xi_j^{(\varepsilon)}\|_X,0 \right\} , \quad \mu(x)=\sum_{j=1}^{m_{\varepsilon}}\mu_j(x) \end{equation}

を考えます。明らかに \mu_j(x) , \mu(x) \ge 0 であり、また、 \mu_j,\mu \in C(K) が成立します。実際、次の等式

\begin{equation} \max\{a,0\}=\frac{1}{2}(|a|+a) \end{equation}

に注意すれば、

\begin{equation}\begin{split} \max\{a,0\}-\max\{b,0\} &=\frac{1}{2}(|a|+a)-\frac{1}{2}(|b|+b)  \\ &=\frac{1}{2}(|a|-|b|+a-b) \\ &\le \frac{1}{2}(|a-b|+|a-b|) \\ &=|a-b| \end{split}\end{equation}

であり、 a,b を入れ替えれば

\begin{equation} |\max\{a,0\}-\max\{b,0\}| \le |a-b| \end{equation}

を得ます。したがって、 x,y \in K に対して

\begin{equation}\begin{split} |\mu_j(x)-\mu_j(y)| &=\left| \max\left\{ 1-\frac{2}{\varepsilon}\|x-\xi_j^{(\varepsilon)}\|_X,0 \right\}-\max\left\{ 1-\frac{2}{\varepsilon}\|y-\xi_j^{(\varepsilon)}\|_X,0 \right\} \right| \\ &\le \left| \left( 1-\frac{2}{\varepsilon}\|x-\xi_j^{(\varepsilon)}\|_X \right)-\left( 1-\frac{2}{\varepsilon}\|y-\xi_j^{(\varepsilon)}\|_X \right) \right| \\ &= \frac{2}{\varepsilon}\left| \|x-\xi_j^{(\varepsilon)}\|_X-\|y-\xi_j^{(\varepsilon)}\|_X \right| \\ &\le \frac{2}{\varepsilon}\|x-y\|_X \end{split}\end{equation}

より \|x-y\|_X \to 0 のとき  |\mu_j(x)-\mu_j(y)| \to 0 すなわち \mu_j,\mu \in C(K) を得ます。さらに、任意の  x\in K に対して \mu(x) \gt 0 が成立します。実際、  x \in K ならば

\begin{equation} K \subset \bigcup_{j=1}^{m_{\varepsilon}} B\left(\xi_j^{(\varepsilon)},\frac{1}{2}\varepsilon\right) \end{equation}

に注意して、ある  1 \le j \le m_{\varepsilon} に対して

\begin{equation} x \in B\left(\xi_j^{(\varepsilon)},\frac{1}{2}\varepsilon\right) \end{equation}

ですが、これは

\begin{equation} \|x-\xi_j^{(\varepsilon)}\|_X \lt \frac{1}{2}\varepsilon \end{equation}

すなわち

\begin{equation} \mu_j(x)=\max\left\{ 1-\frac{2}{\varepsilon}\|x-\xi_j^{(\varepsilon)}\|_X,0 \right\} \gt 0 \end{equation}

を意味します。

\begin{equation} \mu(x)=\sum_{j=1}^{m_{\varepsilon}}\mu_j(x) , \quad \mu_j(x) \ge 0 \end{equation}

より1つでも  \mu_j(x) \gt 0 なる  1 \le j \le m_{\varepsilon} があれば \mu(x) \gt 0 となります。ゆえに、次の関数

\begin{equation} \lambda_j : K \to \mathbb{R}, \quad \lambda_j(x) = \frac{\mu_j(x)}{\mu(x)} \end{equation}

はwell-definedです。さらに、任意の x \in K に対して  \lambda_j(x) \ge 0 かつ  \lambda_j \in C(K) かつ

\begin{equation} \sum_{j=1}^{m_{\varepsilon}} \lambda_j(x)=\sum_{j=1}^{m_{\varepsilon}} \frac{\mu_j(x)}{\mu(x)}=\frac{\sum_{j=1}^{m_{\varepsilon}}\mu_j(x)}{\mu(x)}=\frac{\mu(x)}{\mu(x)}=1 \end{equation}

が成立します。いよいよSchauder射影作用素 P_{\varepsilon} を与えましょう。次の作用素

\begin{equation} P_{\varepsilon}: K \to \mathrm{Conv} \, \{\xi_j^{(\varepsilon)}\} , \quad P_{\varepsilon}x = \sum_{j=1}^{m_{\varepsilon}}\lambda_j(x)\xi_j^{(\varepsilon)} \end{equation}

はwell-definedであり、また P_{\varepsilon} \in C(K:\mathrm{Conv} \, \{\xi_j^{(\varepsilon)}\}) が成立します。実際、 x \in K に対して

\begin{equation} \lambda_j(x) \ge 0 , \quad \sum_{j=1}^{m_{\varepsilon}}\lambda_j(x)=1 , \quad \lambda_j \in C(K) \end{equation}

であるから、初めに注意したように有限個の点列の凸包は

\begin{equation} \mathrm{Conv} \, \{\xi_j^{(\varepsilon)}\} =\left\{ \left. \sum_{j=1}^{m_{\varepsilon}} \alpha_j\xi_j^{(\varepsilon)} \, \right| \, \alpha_j \ge 0 \quad \mathrm{and} \quad \sum_{j=1}^{m_{\varepsilon}} \alpha_j=1 \right\} \end{equation}

と表されることに注意して、

\begin{equation} P_{\varepsilon}x = \sum_{j=1}^{m_{\varepsilon}}\lambda_j(x)\xi_j^{(\varepsilon)} \in \mathrm{Conv} \, \{\xi_j^{(\varepsilon)}\} \end{equation}

を得ます。また、 x,y \in K に対して

\begin{equation} \begin{split} \|P_{\varepsilon}x-P_{\varepsilon}y\|_X &=\left\| \sum_{j=1}^{m_{\varepsilon}}\lambda_j(x)\xi_j^{(\varepsilon)}-\sum_{j=1}^{m_{\varepsilon}}\lambda_j(y)\xi_j^{(\varepsilon)} \right\|_X \\ &=\left\| \sum_{j=1}^{m_{\varepsilon}}\{\lambda_j(x)-\lambda_j(y)\}\xi_j^{(\varepsilon)} \right\|_X \\ &\le \sum_{j=1}^{m_{\varepsilon}}|\lambda_j(x)-\lambda_j(y)|\|\xi_j^{(\varepsilon)}\|_X \\ &\le \max_{1 \le j \le m_{\varepsilon}}|\lambda_j(x)-\lambda_j(y)|\sum_{j=1}^{m_{\varepsilon}}\|\xi_j^{(\varepsilon)}\|_X \end{split}\end{equation}

であるから、  \lambda_j \in C(K) より \|x-y\|_X \to 0 のとき |\lambda_j(x)-\lambda_j(y)| \to 0 であり、 \|P_{\varepsilon}x-P_{\varepsilon}y\|_X \to 0 を得ます。ゆえに P_{\varepsilon} \in C(K:\mathrm{Conv} \, \{\xi_j^{(\varepsilon)}\}) を得ます。

 

最後に、 x\in K に対して \|P_{\varepsilon}x-x\|_X \lt \varepsilon となることを見ましょう。

\begin{equation} \sum_{j=1}^{m_{\varepsilon}}\lambda_j(x)=1 \end{equation}

に注意して、

\begin{equation} P_{\varepsilon}x-x=\sum_{j=1}^{m_{\varepsilon}}\lambda_j(x)\xi_j^{(\varepsilon)} -\sum_{j=1}^{m_{\varepsilon}}\lambda_j(x)x=\sum_{j=1}^{m_{\varepsilon}}\lambda_j(x)(\xi_j^{(\varepsilon)}-x) \end{equation}

を得ます。したがって、

\begin{equation} \|P_{\varepsilon}x-x\|_X \le \sum_{j=1}^{m_{\varepsilon}}\lambda_j(x)\|\xi_j^{(\varepsilon)}-x\|_X \end{equation}

となるわけですが、もし

\begin{equation} \|\xi_j^{(\varepsilon)}-x\|_X \gt \frac{1}{2}\varepsilon \end{equation}

ならば

\begin{equation} \mu_j(x)=\max\left\{ 1-\frac{2}{\varepsilon}\|x-\xi_j^{(\varepsilon)}\|_X,0 \right\} = 0 \end{equation}

だから、このとき \lambda_j(x) = \mu_j(x)/\mu(x)=0 となります。したがって \lambda_j(x) \gt 0 のときは常に

\begin{equation} \|\xi_j^{(\varepsilon)}-x\|_X \le \frac{1}{2}\varepsilon \end{equation}

を満たすので、

\begin{equation} \|P_{\varepsilon}x-x\|_X \le \sum_{j=1}^{m_{\varepsilon}}\lambda_j(x)\|\xi_j^{(\varepsilon)}-x\|_X \le \frac{1}{2}\varepsilon \sum_{j=1}^{m_{\varepsilon}}\lambda_j(x) \lt \varepsilon \end{equation}

を得ます。以上で(i)が証明されました。

 

さて、では(i)を用いて(ii)を示しましょう。さっそく(i)を用います。任意の正の整数 n に対して、有限個の点列 \{\xi_j^{(n)}\}=\{\xi_j^{(n)}\}_{j=1}^{m_n} \subset K およびSchauder射影作用素 P_n \in C(K:\mathrm{Conv} \, \{\xi_j^{(n)}\} ) が存在して、

\begin{equation} \|P_nx-x\|_X \lt \frac{1}{n} \end{equation}

が任意の x \in K に対して成立します。この正の整数 n はあとで極限  n \to \infty を考えるため、少し見づらいですが n に依存する関数や集合はすべて添え字 n を付けておきます。

 

さて、ここで \mathrm{Conv} \, \{\xi_j^{(n)}\} \subset \Omega に注意します。実際、 \{\xi_j^{(n)}\} \subset K \subset \Omega であるから、凸包を与える作用は単調であることより、 \mathrm{Conv} \, \{\xi_j^{(n)}\} \subset \mathrm{Conv} \, K \subset \mathrm{Conv} \, \Omega が成立します。ここで、仮定から \Omega は凸集合であったから、凸集合自身の凸包は自分自身、すなわち \mathrm{Conv} \, \Omega=\Omega です。ゆえに \mathrm{Conv} \, \{\xi_j^{(n)}\} \subset \Omega が成立します。

 

さて、ここで集合 S_n \subset \mathbb{R}^{m_n}

\begin{equation} S_n=\left\{ s=(s_1,\ldots,s_{m_n}) \in \mathbb{R}^{m_n} \, \left| \, s_j \ge 0 \quad \mathrm{and} \quad \sum_{j=1}^{m_n}s_j=1 \right.\right\} \end{equation}

と定義すると、これは有界な凸閉集合です。有界性と凸性を確認します。有界性は

\begin{equation} |s|^2=\sum_{j=1}^{m_n}s_j^2 \le \left(\sum_{j=1}^{m_n}s_j\right)^2=1 \end{equation}

より分かります。凸性は、任意の2点 s,t \in S_n を結ぶ線分 s+\theta (t-s) \, (0 \le \theta \le 1) もまた S_n 上にあればよいですが、これは s+\theta (t-s)=\theta t+(1-\theta) s に注意すれば、 \theta t_j+(1-\theta)s_j \ge 0 および

\begin{equation} \sum_{j=1}^{m_n}\{ \theta t_j+(1-\theta)s_j \}=\theta \sum_{j=1}^{m_n} t_j+(1-\theta)\sum_{j=1}^{m_n}s_j=\theta+(1-\theta)=1 \end{equation}

より直ちに示されます。したがって S_n \subset \mathbb{R}^{m_n}有界な凸閉集合であり、Brouwerの不動点定理における仮定を満たすことに注意します。

 

ここで、次の作用素

\begin{equation} J_n:S_n \to \mathrm{Conv} \, \{\xi_j^{(n)}\} , \quad J_ns = \sum_{j=1}^{m_n}s_j\xi_j^{(n)} \end{equation}

はwell-definedであり、かつ  J_n \in C(S_n:\mathrm{Conv} \, \{\xi_j^{(n)}\}) となります。実際、先に示したことと同様に、有限個の点列に対する凸包の表式

\begin{equation} \mathrm{Conv} \, \{\xi_j^{(n)}\} =\left\{ \left. \sum_{j=1}^{m_n} \alpha_j\xi_j^{(n)} \, \right| \, \alpha_j \ge 0 \quad \mathrm{and} \quad \sum_{j=1}^{m_n} \alpha_j=1 \right\} \end{equation}

 に注意すれば、 S_n の定義から直ちに s \in S_n に対して

\begin{equation} J_ns = \sum_{j=1}^{m_n}s_j\xi_j^{(n)} \in \mathrm{Conv} \, \{\xi_j^{(n)}\} \end{equation}

を得ます。また s,t \in S_n に対して

\begin{equation}\begin{split} \|J_ns-J_nt\|_X &=\left\| \sum_{j=1}^{m_n}s_j\xi_j^{(n)}-\sum_{j=1}^{m_n}t_j\xi_j^{(n)} \right\|_X \\ &= \left\| \sum_{j=1}^{m_n}(s_j-t_j)\xi_j^{(n)} \right\|_X \\ &\le \sum_{j=1}^{m_n}|s_j-t_j|\|\xi_j^{(n)}\|_X \\ &\le |s-t| \sum_{j=1}^{m_n}\|\xi_j^{(n)}\|_X\end{split}\end{equation}

なので、 |s-t| \to 0 のとき \|J_ns-J_nt\|_X \to 0 を得ます。したがって J_n \in C(S_n:\mathrm{Conv} \, \{\xi_j^{(n)}\}) を得ます。

 

さて、いよいよ不動点の存在を示します。ここで不動点の存在をいいたい f \in C(\Omega:K) をとります。次に、関数 g_n を、(i)の証明時に定義した関数 \lambda_j を用いて

\begin{equation} g_n:S_n \to S_n , \quad g_n(s)=( (\lambda_1 \circ f \circ J_n)(s), \ldots, (\lambda_{m_n} \circ f \circ J_n)(s) ) \end{equation}

とすると、これはwell-definedであり、また  g_n \in C(S_n:S_n) となります。実際、初めに注意したことから \mathrm{Conv} \, \{\xi_j^{(n)}\} \subset \Omega であり、また

\begin{equation} J_n \in C(S_n:\mathrm{Conv} \, \{\xi_j^{(n)}\}) , \, f \in C(\Omega:K) , \, \lambda_j \in C(K) \end{equation}

に注意すれば、任意の s \in S_n に対して J_ns \in \mathrm{Conv} \, \{\xi_j^{(n)}\} \subset \Omega であり、ゆえに f(J_ns) \in K です。したがって (\lambda_j \circ f \circ J_n)(s)=\lambda_j(f(J_ns)) は定義可能で、 \lambda_j の性質から任意の x \in K に対して

\begin{equation} \lambda_j(x) \ge 0, \quad \sum_{j=1}^{m_{\varepsilon}} \lambda_j(x)=1 \end{equation}

が成立します。したがって S_n の定義から

\begin{equation} g_n(s)=( (\lambda_1 \circ f \circ J_n)(s), \ldots, (\lambda_{m_n} \circ f \circ J_n)(s) ) \in S_n \end{equation}

が分かります。また、連続関数の合成はまた連続であるから、  g_n \in C(S_n:S_n) です。

 

さて、ここでBrouwerの不動点定理を用います。先ほど注意したように S_n \subset \mathbb{R}^{m_n}有界な凸閉集合であり、Brouwerの不動点定理の仮定を満たします。ゆえに  g_n \in C(S_n:S_n)不動点をもちます。したがって g_n(s^{(n)})=s^{(n)} を満たすような s^{(n)} \in S_n が存在します。この n は(i)で現れる任意の正の整数でしたから、関数列 \{g_n\} \subset S_n に応じた不動点の点列 \{s^{(n)}\} \subset S_n を得ます。この点列は s^{(n)} \in S_n \subset \mathbb{R}^{m_n} ですから m_n 次元vectorであり、この j 成分を s_j^{(n)} とかくと、

\begin{equation} g_n(s^{(n)})=( (\lambda_1 \circ f \circ J_n)(s^{(n)}), \ldots, (\lambda_{m_n} \circ f \circ J_n)(s^{(n)}) )=s^{(n)}  \end{equation}

j 成分は (\lambda_j \circ f \circ J_n)(s^{(n)})=\lambda_j(f(J_ns^{(n)}))=s_j^{(n)} で与えられます。さて、Schauder射影作用素の定義は、任意の x \in K に対して

\begin{equation} P_nx = \sum_{j=1}^{m_n}\lambda_j(x)\xi_j^{(n)} \end{equation}

であったことに注意すると、上の等式から

\begin{equation} P_nf(J_ns^{(n)})=\sum_{j=1}^{m_n}\lambda_j(f(J_ns^{(n)}))\xi_j^{(n)}=\sum_{j=1}^{m_n}s_j^{(n)}\xi_j^{(n)}=J_ns^{(n)} \end{equation}

を得ます。最後の等式は J_n の定義です。

 

さて、点列 s^{(n)} \in S_n に対して J_ns^{(n)} \in \mathrm{Conv} \, \{\xi_j^{(n)}\} であり、また初めに注意したことから \mathrm{Conv} \, \{\xi_j^{(n)}\} \subset \Omega なので、点列 \{x^{(n)}\}x^{(n)}=J_ns^{(n)} で定義すれば \{x^{(n)}\} \subset \Omega です。また上式から P_nf(x^{(n)})=x^{(n)} を得ます。ここで、仮定から fx^{(n)} \in \Omega に対して f(x^{(n)}) \in K を与えることに注意します。初めに(i)を用いて任意の x \in K に対して

\begin{equation} \|P_nx-x\|_X \lt \frac{1}{n} \end{equation}

が成立していたから、これを用いれば

\begin{equation} \|x^{(n)}-f(x^{(n)})\|_X=\|P_nf(x^{(n)})-f(x^{(n)})\|_X \lt \frac{1}{n} \end{equation}

が分かります。さて、 \{f(x^{(n)})\} \subset K かつ K がcompactであることから、点列compactの定義より適当な部分列 \{f(x^{(n_j)})\} \subset K を選べばこの部分列は収束します。これを x \in K としましょう。すなわち

\begin{equation} \|f(x^{(n_j)})-x\|_X \to 0 \quad (j \to \infty) \end{equation}

が成立します。これが求める不動点です。以下、これを確かめましょう。

 

上の式に注意して、

\begin{equation}\begin{split} \|x^{(n_j)}-x\|_X &\le \|x^{(n_j)}-f(x^{(n_j)})\|_X+\|f(x^{(n_j)})-x\|_X \\ &\le \frac{1}{n_j}+\|f(x^{(n_j)})-x\|_X  \\ &\to 0 \quad (j \to \infty) \end{split}\end{equation}

を得るから、

\begin{equation} \|f(x)-x\|_X \le \|f(x)-f(x^{(n_j)})\|_X+\|f(x^{(n_j)})-x\|_X \end{equation}

とすれば右辺第1項は f \in C(\Omega:K) から、 0 に収束します。ゆえに不動点 f(x)=x の存在が示されました。

 

これがSchauderの不動点定理です。なかなか証明が大変でしたね。証明を追ってもどうやってこういうアプローチを思い浮かべたのかはよく分かりません。しかしながらSchauder射影作用素が非常に重要であることは分かります。無限次元であるSchauderを示すのに有限次元でのBrouwerをうまく使いたいわけですが、ここでSchauder射影作用素が効いています。無限次元空間でのすべての元に対して、その有限個の点列の凸包でもって不等式を成立させていますから、これによって有限個の点列から有限次元でのBrouwerの結果を使えるようにするわけです。なかなか考えましたね……

 

Banachの不動点定理では縮小写像という、写像に非常に強い制限を課していますが、Schauderは集合をcompactにすることで、写像はただの連続性だけでよいという非常にゆるい仮定において使えるというのがよいですね。

 

さて、これでやっと不動点定理が示せたので、さっそくこの不動点定理を用いて微分方程式を解いてみたいと思います。がんばるぞ~~

 

今回も見てくださってありがとうございます。

Brouwerの不動点定理について

こんにちは。ひよこてんぷらです。やっと修論の発表会が終わり、論文にまた取り組めます。やったね。

 

現在研究しているのはKeller-Segel方程式で、この調子でいけば、scale不変な斉次Besov空間を初期値空間とするparabolic-parabolic typeの時間Lorentz classの解の存在、そして時空間解析性、また同様の考察をparabolic-elliptic typeにおいて行うことで、合計4本の論文をかけそうです。

 

次に先生から推奨されている研究が、Keller-SegelとEuler方程式のcouplingについてです。2つの方程式系のcouplingがどの程度意義のある研究かは分かりませんが、少なくともKeller-SegelとNavier-Stokesにおける研究は盛んに行なわれています。

 

ではEulerはどうか。Euler方程式はNavier-Stokesにおける粘性項 -\Delta u を消去した方程式です。実はNavier-Stokesより難しく、例えばNavier-Stokesは初期値が十分小さければ一般次元上で時間大域的な解の存在を言えるようですが、Eulerは例え初期値が小さかったとしても時間大域解の存在はまだ2次元でしか言えていないようです(ただし2次元では初期値が小さくなくても大域解を構成できます)。

 

2次元Euler方程式の解析としては例えば加藤氏の論文(On Classical Solutions of the Two-Dimensional Non-Stationary Euler Equation)がありますが、今回はKeller-SegelとEuler方程式のcouplingを理解するべく、まずこの論文を理解したいと思います。

 

そこで、今回は本論文の解の存在理論として使われている不動点定理を勉強しました。大学の講義で勉強したことがあったのはBanachの不動点定理、すなわち縮小写像に関する不動点の存在ですが、これの証明は簡単で、縮小写像 f に繰り返し代入することで得られる点列 x_{j+1}=f(x_j) がCauchy列となることを言えればよいです。

 

一方、今回勉強したい不動点定理はSchauderの不動点定理ですが、これにはまずBrouwerの不動点定理の理解が必要です。そういうわけで、今回はBrouwerの不動点定理を勉強しました。

 

この証明はなかなか難しく、背理法で示すので、非構成的な存在証明です。つまり、いつでも f(x) \neq x となることを仮定して、矛盾を導きます。

 

では定理を紹介します。有界な凸閉集合 \Omega \subset \mathbb{R}^n に対して、 f \in C(\Omega:\Omega) ならば f(x)=x なる x \in \Omega が存在します。これがBrouwerの不動点定理です。

 

ここで、不動点の一意性は導かれないことに注意します(Banachの不動点定理は一意性も成立する)。凸集合とは、膨らんでいる集合のことです。正確には、 \Omega 内のどんな2点を結んでも、その線分も \Omega に含まれるとき凸集合といいます。また、 f \in C(\Omega:\Omega)\Omega から自分自身への連続写像を意味します。

 

では証明しましょう。初めに、 \overline{B} を十分大きな半径 R \gt 0 を持つ原点中心の閉球として、 f \in C^{\infty}(\overline{B}:\overline{B}) に対して主張を示します。

 

背理法で示しましょう。すなわち、任意の各点  x \in \overline{B} に対して T=T(x)=x-f(x) \neq 0 と仮定して、矛盾を導きましょう。このとき  T \neq 0 であるから、次の2次方程式 |x+yT|^2=R^2 を考えることができます( y が実数で、 x および T=T(x)n 次元vectorであることに注意します)。展開すると

\begin{equation} |T|^2y^2+2(x,T)y+|x|^2-R^2=0 \end{equation}

ですから、この方程式の解は

\begin{equation} y=\frac{-(x,T)\pm \sqrt{(x,T)^2+(R^2-|x|^2)|T|^2}}{|T|^2} \end{equation}

となります。ここで、関数 \lambda (x)

\begin{equation} \lambda(x)=\frac{-(x,T)+ \sqrt{(x,T)^2+(R^2-|x|^2)|T|^2}}{|T|^2} \end{equation}

で定義します。当然 \lambda(x) は初めの等式 |x+\lambda(x)T|^2=R^2 を満たします。

 

さて、いま  x , \, f(x) \in \overline{B} ですから |x| , \, |f| \le R に注意します。もし (x,T) \le 0 かつ |x|=R ならば、

\begin{equation} \begin{split} |T|^2 &=(x-f,x-f) \\ &=|x|^2-2(x,f)+|f|^2 \\ &=|x|^2+|f|^2-2(x,x-T) \\ &=|x|^2+|f|^2-2|x|^2+2(x,T) \\ &=|f|^2-|x|^2+2(x,T) \\ &=|f|^2-R^2+2(x,T) \\ &\le 2(x,T) \\ &\le 0 \end{split} \end{equation}

より T=0 となりますが、仮定から T \neq 0 より矛盾です。すなわち (x,T) \gt 0 または |x| \lt R が成立します。これを (*) としましょう。

 

では関数 \lambda(x) の性質を調べましょう。まず

\begin{equation} \begin{split} \lambda(x) &=\frac{-(x,T)+ \sqrt{(x,T)^2+(R^2-|x|^2)|T|^2}}{|T|^2} \\ &\ge \frac{-|(x,T)|+ \sqrt{(x,T)^2}}{|T|^2} \\ &=0 \end{split} \end{equation}

より \lambda(x) は非負値です。根号の中に対して、もし

\begin{equation} (x,T)^2+(R^2-|x|^2)|T|^2=0 \end{equation}

ならば、  T \neq 0 に注意して (x,T)=0 かつ |x|=R を得ます。ところがこれは (*) より矛盾しますから、根号の中は常に正の値をとります。ここで f \in C^{\infty}(\overline{B}:\overline{B}) より TC^{\infty} 級で、 \lambda(x)C^{\infty} 級です( f が非負値 C^{\infty} 級でも \sqrt{f}C^{\infty} 級とは限らないことに注意しましょう。1階微分時に f=0 まわりで特異点を持ちます。根号内が常に正なら C^{\infty} 級です)。また、 |x|=R のとき、 (*) より (x,T) \gt 0 に注意して、

\begin{equation} \begin{split} \left.\lambda(x)\right|_{|x|=R} &=\left.\frac{-(x,T)+ \sqrt{(x,T)^2+(R^2-|x|^2)|T|^2}}{|T|^2}\right|_{|x|=R} \\ &= \frac{-(x,T)+ \sqrt{(x,T)^2}}{|T|^2} \\ &=0 \end{split} \end{equation}

を得ます。まとめると、 \lambda(x) は非負値 C^{\infty} 級かつ \left.\lambda(x)\right|_{|x|=R}=0 かつ |x+\lambda(x)T|=R を満たします。

 

さて、再び新しい関数を定義します。

\begin{equation} \varphi : [0,1] \times \overline{B} \to \mathbb{R}^n , \quad \varphi(t,x)=x+t\lambda(x)T(x) \end{equation}

ここでこの関数はvector値で、 t , \, \lambda(x) が実数値であることに注意します。さて、 \lambda(x) , \, T(x)C^{\infty} 級ですから、やはり \varphix に関して C^{\infty} 級です。 \varphi の性質を調べます。まず \varphi(0,x)=x です。また、 \varphi(1,x)=x+\lambda(x)T(x) であり、  |x+\lambda(x)T|=R より |\varphi(1,x)|=R です。そして、 \partial_t\varphi(t,x)=\lambda(x)T(x) および \left.\lambda(x)\right|_{|x|=R}=0 から \left.\partial_t\varphi(t,x)\right|_{|x|=R}=0 となります。まとめると、

\begin{equation} \varphi(0,x)=x , \quad |\varphi(1,x)|=R, \quad \left.\partial_t\varphi(t,x)\right|_{|x|=R}=0 \end{equation}

です。さて、 x および \varphi はどちらも n 次元vector値であるから、Jacobi行列を定義できます。すなわち \varphi=(\varphi_1,\ldots,\varphi_n) として、

\begin{equation} \frac{\partial \varphi}{\partial x}(t,x) = \left(\begin{array}{ccc} \partial_{x_1}\varphi_1 & \cdots & \partial_{x_n}\varphi_1 \\ \vdots & \ddots & \vdots \\ \partial_{x_1}\varphi_n & \ldots & \partial_{x_n}\varphi_n \end{array}\right) \end{equation}

とします。

 

さて、いよいよ矛盾を導きましょう。Jacobi行列の行列式積分します。

\begin{equation} I(t)=\int_{\overline{B}} \left| \frac{\partial \varphi}{\partial x}(t,x) \right| dx \end{equation}

右辺はscalar関数の \overline{B} 上の n積分です。まずは t=0,1 を代入してみましょう。先ほど示した結果を用います。 t=0 のときは、 \varphi(0,x)=x より対応するJacobi行列は単位行列で、

\begin{equation} \left| \frac{\partial \varphi}{\partial x}(0,x) \right|=\left|\begin{array}{ccc} 1 & \cdots & 0 \\ \vdots & \ddots & \vdots \\ 0 & \ldots & 1 \end{array}\right| =1\end{equation}

すなわち

\begin{equation} I(0)=\int_{\overline{B}} \left| \frac{\partial \varphi}{\partial x}(0,x) \right| dx =\int_{\overline{B}} dx=|\overline{B}| \end{equation}

 を得ます。次に t=1 のとき、 |\varphi(1,x)|^2=R^2 ですから、この微分を計算して

\begin{equation}\begin{split} \partial_{x_j}\left\{|\varphi(1,x)|^2\right\} &= \partial_{x_j}\left\{ \varphi_1(1,x)^2+\cdots +\varphi_n(1,x)^2 \right\} \\ &=2\varphi_1(1,x)\partial_{x_j}\varphi_1(1,x)+\cdots +2\varphi_n(1,x)\partial_{x_j}\varphi_n(1,x) \\ &=0 \end{split}\end{equation}

を得ます。最後の 0 は右辺の R^2微分です。これを各 j に対して求めてから並べてやると、連立方程式

\begin{equation} \begin{gathered} 2\varphi_1(1,x)\partial_{x_1}\varphi_1(1,x)+\cdots +2\varphi_n(1,x)\partial_{x_1}\varphi_n(1,x) =0 \\ \vdots \\ 2\varphi_1(1,x)\partial_{x_j}\varphi_1(1,x)+\cdots +2\varphi_n(1,x)\partial_{x_j}\varphi_n(1,x) =0 \\ \vdots \\ 2\varphi_1(1,x)\partial_{x_n}\varphi_1(1,x)+\cdots +2\varphi_n(1,x)\partial_{x_n}\varphi_n(1,x) =0 \end{gathered} \end{equation}

を得ますが、これは行列を使ってやると

\begin{equation} 2\left(\begin{array}{ccc} \partial_{x_1}\varphi_1 & \cdots & \partial_{x_n}\varphi_1 \\ \vdots & \ddots & \vdots \\ \partial_{x_1}\varphi_n & \ldots & \partial_{x_n}\varphi_n \end{array}\right) \left(\begin{array}{c} \varphi_1 \\ \vdots \\ \varphi_n \end{array}\right)=\left(\begin{array}{c} 0 \\ \vdots \\ 0 \end{array}\right) \end{equation}

すなわち

\begin{equation} 2\frac{\partial \varphi}{\partial x}(1,x)\varphi(1,x)=0 \end{equation}

を得ます。さて、線形代数における方程式 Ax=b|A| \neq 0 ならば逆行列を用いて x=A^{-1}b となることが分かりますから、

\begin{equation} \left|\frac{\partial \varphi}{\partial x}(1,x)\right| \neq 0 \end{equation}

ならば \varphi(1,x)=0 となります。しかし |\varphi(1,x)|=R よりこれは矛盾ですから、

\begin{equation} \left|\frac{\partial \varphi}{\partial x}(1,x)\right| = 0 \end{equation}

です。したがって

\begin{equation} I(1)=\int_{\overline{B}} \left| \frac{\partial \varphi}{\partial x}(1,x) \right| dx =0 \end{equation}

となります。ここで I(0)=|\overline{B}| \neq 0=I(1) に注目します。矛盾を示すために、任意の 0 \le t \le 1 に対して \partial_tI(t)=0 であることを示しましょう。これが分かれば I(t)t によらない定数になりますが、それは I(0) \neq I(1) に矛盾します。これを示せば初めの仮定である、任意の各点  x \in \overline{B} に対して T=T(x)=x-f(x) \neq 0 が間違いですから、ある点  x \in \overline{B} に対して f(x)=x が言えます。すなわち不動点の存在です。

 

いよいよ最後の主張である \partial_tI(t)=0 を示します。さて、まずは

\begin{equation} \partial_tI(t)=\partial_t \int_{\overline{B}} \left| \frac{\partial \varphi}{\partial x}(t,x) \right| dx \end{equation}

ですから、積分記号下での微分を使って

\begin{equation} \partial_tI(t)=\int_{\overline{B}} \partial_t \left| \frac{\partial \varphi}{\partial x}(t,x) \right| dx \end{equation}

としましょう。 \varphix に関する C^{\infty} 級関数で、 (t,x)有界閉集合上しか動かないので、特に難しいことは考えず上式が成立します。

 

さて、ここからは行列式の計算が出てきますが、表記の簡略化のために1列成分だけ書きます。まずは関数行列式微分に関してですが、これは各行(または列)の微分で表されます。例えば1変数行列関数

\begin{equation} A(x)=\left(\begin{array}{ccc} a_{11}(x) & a_{12}(x) & a_{13}(x) \\ a_{21}(x) & a_{22}(x) & a_{23}(x) \\ a_{31}(x) & a_{32}(x) & a_{33}(x) \end{array} \right) =\left(\begin{array}{ccc} a_{11} & a_{12} & a_{13} \\ a_{21} & a_{22} & a_{23} \\ a_{31} & a_{32} & a_{33} \end{array} \right) \end{equation}

に対しては、

\begin{equation} \partial_x|A(x)|= \left|\begin{array}{ccc} a'_{11} & a'_{12} & a'_{13} \\ a_{21} & a_{22} & a_{23} \\ a_{31} & a_{32} & a_{33} \end{array} \right|+\left|\begin{array}{ccc} a_{11} & a_{12} & a_{13} \\ a'_{21} & a'_{22} & a'_{23} \\ a_{31} & a_{32} & a_{33} \end{array} \right|+\left|\begin{array}{ccc} a_{11} & a_{12} & a_{13} \\ a_{21} & a_{22} & a_{23} \\ a'_{31} & a'_{32} & a'_{33} \end{array} \right| \end{equation}

といった具合です。したがって、

\begin{equation} \partial_t \left| \frac{\partial \varphi}{\partial x} \right| =\sum_{j=1}^n \left| \begin{array}{cc} \partial_{x_1}\varphi_1 & \cdots \\ \vdots & \\ \partial_t\partial_{x_j}\varphi_1 & \cdots (j) \\ \vdots & \\ \partial_{x_n}\varphi_1 & \cdots \end{array}\right| \end{equation}

となります( (j) で行列の j 行成分を意味していることとします)。

 

さて、次は \partial_t\partial_{x_j} の部分から \partial_{x_j} を取り出します。つまり

\begin{equation} \sum_{j=1}^n \partial_{x_j} \left| \begin{array}{cc} \partial_{x_1}\varphi_1 & \cdots \\ \vdots & \\ \partial_t\varphi_1 & \cdots (j) \\ \vdots & \\ \partial_{x_n}\varphi_1 & \cdots \end{array}\right| \end{equation}

という形を作ります。さて、再び行列式微分を用います。各 j を固定して、

\begin{equation} \partial_{x_j} \left| \begin{array}{cc} \partial_{x_1}\varphi_1 & \cdots \\ \vdots & \\ \partial_t\varphi_1 & \cdots (j) \\ \vdots & \\ \partial_{x_n}\varphi_1 & \cdots \end{array}\right|=\sum_{i \neq j} \left| \begin{array}{cc} \partial_{x_1}\varphi_1 & \cdots \\ \vdots & \\ \partial_{x_j}\partial_{x_i}\varphi_1 & \cdots (i) \\ \vdots & \\ \partial_t\varphi_1 & \cdots (j) \\ \vdots & \\ \partial_{x_n}\varphi_1 & \cdots \end{array}\right|+\left| \begin{array}{cc} \partial_{x_1}\varphi_1 & \cdots \\ \vdots & \\ \partial_{x_j}\partial_t\varphi_1 & \cdots (j) \\ \vdots & \\ \partial_{x_n}\varphi_1 & \cdots \end{array}\right|   \end{equation}

です。各 j が固定なので、和は i が動いています。これは左辺に対して行列式微分を行い、和を i \neq j として i=j の部分だけ取り出しているだけです。 i=j の部分を先に計算した \partial_t|\partial \varphi/\partial x| に突っ込んで計算します。

\begin{equation} \begin{split} \partial_t \left| \frac{\partial \varphi}{\partial x} \right| &=\sum_{j=1}^n \left| \begin{array}{cc} \partial_{x_1}\varphi_1 & \cdots \\ \vdots & \\ \partial_t\partial_{x_j}\varphi_1 & \cdots (j) \\ \vdots & \\ \partial_{x_n}\varphi_1 & \cdots \end{array}\right| \\ &=\sum_{j=1}^n\left( \partial_{x_j} \left| \begin{array}{cc} \partial_{x_1}\varphi_1 & \cdots \\ \vdots & \\ \partial_t\varphi_1 & \cdots (j) \\ \vdots & \\ \partial_{x_n}\varphi_1 & \cdots \end{array}\right| - \sum_{i \neq j} \left| \begin{array}{cc} \partial_{x_1}\varphi_1 & \cdots \\ \vdots & \\ \partial_{x_j}\partial_{x_i}\varphi_1 & \cdots (i) \\ \vdots & \\ \partial_t\varphi_1 & \cdots (j) \\ \vdots & \\ \partial_{x_n}\varphi_1 & \cdots \end{array}\right|\right) \\ &=\sum_{j=1}^n \partial_{x_j} \left| \begin{array}{cc} \partial_{x_1}\varphi_1 & \cdots \\ \vdots & \\ \partial_t\varphi_1 & \cdots (j) \\ \vdots & \\ \partial_{x_n}\varphi_1 & \cdots \end{array}\right|- \sum_{j=1}^n\sum_{i \neq j} \left| \begin{array}{cc} \partial_{x_1}\varphi_1 & \cdots \\ \vdots & \\ \partial_{x_j}\partial_{x_i}\varphi_1 & \cdots (i) \\ \vdots & \\ \partial_t\varphi_1 & \cdots (j) \\ \vdots & \\ \partial_{x_n}\varphi_1 & \cdots \end{array}\right| \end{split} \end{equation}

さて、いよいよ計算がめんどくさくなってきました。ここで示したいことは、右辺第2項が 0 となることです。すなわち

\begin{equation} \sum_{j=1}^n\sum_{i \neq j} \left| \begin{array}{cc} \partial_{x_1}\varphi_1 & \cdots \\ \vdots & \\ \partial_{x_j}\partial_{x_i}\varphi_1 & \cdots (i) \\ \vdots & \\ \partial_t\varphi_1 & \cdots (j) \\ \vdots & \\ \partial_{x_n}\varphi_1 & \cdots \end{array}\right|=\sum_{1 \le i,j \le n , i \neq j} \left| \begin{array}{cc} \partial_{x_1}\varphi_1 & \cdots \\ \vdots & \\ \partial_{x_j}\partial_{x_i}\varphi_1 & \cdots (i) \\ \vdots & \\ \partial_t\varphi_1 & \cdots (j) \\ \vdots & \\ \partial_{x_n}\varphi_1 & \cdots \end{array}\right|=0 \end{equation}

を示します。さて、これを示すには、 i \neq j に着目します。和の項において (i,j) の項と (j,i) の項の順番を入れ替えます。このとき

\begin{equation} \sum_{1 \le i,j \le n , i \neq j} \left| \begin{array}{cc} \partial_{x_1}\varphi_1 & \cdots \\ \vdots & \\ \partial_{x_j}\partial_{x_i}\varphi_1 & \cdots (i) \\ \vdots & \\ \partial_t\varphi_1 & \cdots (j) \\ \vdots & \\ \partial_{x_n}\varphi_1 & \cdots \end{array}\right|=\sum_{1 \le i,j \le n , i \neq j} \left| \begin{array}{cc} \partial_{x_1}\varphi_1 & \cdots \\ \vdots & \\ \partial_t\varphi_1 & \cdots (i) \\ \vdots & \\\partial_{x_i}\partial_{x_j}\varphi_1 & \cdots (j)  \\ \vdots & \\ \partial_{x_n}\varphi_1 & \cdots \end{array}\right| \end{equation}

ですから、差をとって

\begin{equation} \sum_{1 \le i,j \le n , i \neq j}\left( \left| \begin{array}{cc} \partial_{x_1}\varphi_1 & \cdots \\ \vdots & \\ \partial_{x_j}\partial_{x_i}\varphi_1 & \cdots (i) \\ \vdots & \\ \partial_t\varphi_1 & \cdots (j) \\ \vdots & \\ \partial_{x_n}\varphi_1 & \cdots \end{array}\right|- \left| \begin{array}{cc} \partial_{x_1}\varphi_1 & \cdots \\ \vdots & \\ \partial_t\varphi_1 & \cdots (i) \\ \vdots & \\\partial_{x_i}\partial_{x_j}\varphi_1 & \cdots (j)  \\ \vdots & \\ \partial_{x_n}\varphi_1 & \cdots \end{array}\right|\right)=0 \end{equation}

を得ます。ここで行列式の性質から、行を1回入れ替えると符号が変わり、

\begin{equation} \left| \begin{array}{cc} \partial_{x_1}\varphi_1 & \cdots \\ \vdots & \\ \partial_t\varphi_1 & \cdots (i) \\ \vdots & \\\partial_{x_i}\partial_{x_j}\varphi_1 & \cdots (j)  \\ \vdots & \\ \partial_{x_n}\varphi_1 & \cdots \end{array}\right|=-\left| \begin{array}{cc} \partial_{x_1}\varphi_1 & \cdots \\ \vdots & \\ \partial_{x_i}\partial_{x_j}\varphi_1& \cdots (i) \\ \vdots & \\ \partial_t\varphi_1 & \cdots (j)  \\ \vdots & \\ \partial_{x_n}\varphi_1 & \cdots \end{array}\right|\end{equation}

すなわち上式は

\begin{equation} 2\sum_{1 \le i,j \le n , i \neq j} \left| \begin{array}{cc} \partial_{x_1}\varphi_1 & \cdots \\ \vdots & \\ \partial_{x_j}\partial_{x_i}\varphi_1 & \cdots (i) \\ \vdots & \\ \partial_t\varphi_1 & \cdots (j) \\ \vdots & \\ \partial_{x_n}\varphi_1 & \cdots \end{array}\right|=0 \end{equation}

であり、主張を得ます。行の入れ替えの際に、 i=j となってしまうと入れ替えられないので、ここで i \neq j であることが効いています。ゆえに、先の計算結果は

\begin{equation} \begin{split} \partial_t \left| \frac{\partial \varphi}{\partial x} \right| &=\sum_{j=1}^n \partial_{x_j} \left| \begin{array}{cc} \partial_{x_1}\varphi_1 & \cdots \\ \vdots & \\ \partial_t\varphi_1 & \cdots (j) \\ \vdots & \\ \partial_{x_n}\varphi_1 & \cdots \end{array}\right| \end{split} \end{equation}

となります。

 

いよいよ積分を計算しましょう。

\begin{equation} \partial_tI(t)=\int_{\overline{B}} \partial_t \left| \frac{\partial \varphi}{\partial x}(t,x) \right| dx= \int_{\overline{B}} \sum_{j=1}^n \partial_{x_j} \left| \begin{array}{cc} \partial_{x_1}\varphi_1 & \cdots \\ \vdots & \\ \partial_t\varphi_1 & \cdots (j) \\ \vdots & \\ \partial_{x_n}\varphi_1 & \cdots \end{array}\right| dx\end{equation}

を求めることになりますが、これにはGaussの発散定理を用います。Gaussの発散定理は、 n 次元vector値関数 f に対して

\begin{equation} \int_{\Omega} \mathrm{div} f(x)dx=\int_{\partial\Omega} f(x) \cdot \nu dS \end{equation}

が成立するというやつです。 \nu は境界上の各点における単位法線vectorです。さて、ここで f=(f_1,\ldots,f_n) , \, \nu=(\nu_1,\ldots , \nu_n) とおいて、

\begin{equation} \int_{\Omega} \sum_{j=1}^n\partial_{x_j}f_j(x)dx=\int_{\partial\Omega} \sum_{j=1}^nf_j(x)\nu_j dS\end{equation}

と書き換えていきましょう。さて、上式の積分\overline{B} 上なので、境界 |x|=R 上の単位法線vector\nu=x/|x|=x/R となります。したがって、Gaussの発散定理から

\begin{equation} \partial_tI(t)= \int_{\overline{B}} \sum_{j=1}^n \partial_{x_j} \left| \begin{array}{cc} \partial_{x_1}\varphi_1 & \cdots \\ \vdots & \\ \partial_t\varphi_1 & \cdots (j) \\ \vdots & \\ \partial_{x_n}\varphi_1 & \cdots \end{array}\right| dx = \int_{|x|=R} \sum_{j=1}^n \left| \begin{array}{cc} \partial_{x_1}\varphi_1 & \cdots \\ \vdots & \\ \partial_t\varphi_1 & \cdots (j) \\ \vdots & \\ \partial_{x_n}\varphi_1 & \cdots \end{array}\right| \frac{x_j}{R} dS\end{equation}

です。さて、先に示した \varphi の性質から \left.\partial_t\varphi(t,x)\right|_{|x|=R}=0 ですから、面積分が |x|=R であること、また各行列式j 行目は (\partial_t\varphi_1(t,x),\ldots , \partial_t\varphi_n(t,x)) であることに注意すれば、被積分関数行列式の各 j 行成分はすべて 0 となり、したがって \partial_tI(t)=0 が分かります。これより主張を得ました。

 

さて、これで定理の証明が終わった、といいたいですが、関数 f f \in C^{\infty}(\overline{B}:\overline{B}) という条件を課していました。初めに述べた定理では、有界な凸閉集合 \Omega \subset \mathbb{R}^n に対して f \in C(\Omega:\Omega) という条件で示すことができます。以下、これを確認していきましょう。

 

まず、 f \in C(\overline{B}:\overline{B}) という条件のもとで示してみましょう。この f に対して、

\begin{equation} \sup_{x \in \overline{B}}|f(x)-f_j(x)| \to 0 \quad (j \to \infty) \end{equation}

を満たすような関数列  \{f_j\} \subset C^{\infty}(\overline{B}:\overline{B}) がとれます。つまり、任意の連続関数は、滑らかな関数で一様収束の意味で近似可能です。さて、ここで先に示した不動点定理より、各関数列 f_j に対して f_j(x_j)=x_j を満たす x_j \in \overline{B} が存在します。当然ながら関数列なので、関数に応じて不動点も異なることに注意しましょう。

 

さて、 \overline{B}有界閉集合なのでcompactです。点列compactの定義から、不動点の点列 \{x_j\} \subset \overline{B} に対して、収束する部分列 \{x_{j_k}\} \subset \overline{B} がとれます。この極限を x \in \overline{B} としましょう。すなわち

\begin{equation} |x_{j_k}-x| \to 0 \quad (k \to \infty) \end{equation}

です。さて、この x \in \overline{B} が求める不動点です。実際、三角不等式から

\begin{equation} |f(x)-x| \le |f(x)-f(x_{j_k})|+|f(x_{j_k})-f_{j_k}(x_{j_k})|+|x_{j_k}-x| \end{equation}

が成立します。ここで f_{j_k}(x_{j_k})=x_{j_k} を用いました。さて、ではこの極限をとるわけですが、まず仮定から f \in C(\overline{B}:\overline{B}) より第1項は

\begin{equation} |f(x)-f(x_{j_k})| \to 0 \quad (k \to \infty) \end{equation}

です。第2項は、近似列 f_j が一様収束の意味で収束することから、

\begin{equation} |f(x_{j_k})-f_{j_k}(x_{j_k})| \le \sup_{\xi \in \overline{B}}|f(\xi)-f_{j_k}(\xi)| \to 0 \quad (k \to \infty) \end{equation}

とすればOKです。ゆえに、極限をとって f(x)=x を得ます。したがって、 f \in C(\overline{B}:\overline{B}) において不動点の存在が言えました。

 

最後に、有界な凸閉集合 \Omega \subset \mathbb{R}^n に対して f \in C(\Omega:\Omega) という仮定の下で、主張を示しましょう。まずは \Omega有界であるということから十分大きな閉球 \overline{B} \Omega \subset \overline{B} を満たすようにできることに注意しましょう。

 

ここで、次の主張を示します。任意の x \in \overline{B} に対して

\begin{equation} |x-y| = \min_{z \in \Omega}|x-z| \end{equation}

を満たすような  y \in \Omega がただ1つ存在します。実際、 \Omega有界閉集合であるからcompactであり、したがって各点 x \in \overline{B} に対して z \in \Omega を変数にもつ連続関数 |x-z| は最小値を持ちます。ゆえに

\begin{equation} |x-y| = \min_{z \in \Omega}|x-z| \end{equation}

を満たすような  y \in \Omega が少なくとも1つとれます。この  y \in \Omega の一意性を見ましょう。2つの点   x_1,x_2 \in \overline{B} に対して、対応する点 y_1,y_2 \in \Omega をとります。 \Omega は凸集合ですから、 y_1,y_2 \in \Omega を結ぶ線分上の点 y_1+t(y_2-y_1) , \, y_2+t(y_1-y_2) \, (0 \le t \le 1)\Omega に属します。さて、 y_1,y_2 \in \Omega の定義から、

\begin{equation} \begin{split} |x_2-\{y_2+t(y_1-y_2)\}|^2 &\ge \min_{z \in \Omega} |x_2-z|^2=|x_2-y_2|^2 \\ |x_1-\{y_1+t(y_2-y_1)\}|^2 &\ge \min_{z \in \Omega} |x_1-z|^2=|x_1-y_1|^2 \end{split} \end{equation}

です。これを展開して整理しましょう。上の式を展開します。

\begin{equation}\begin{split} |x_2|^2-2(x_2,y_2+t(y_1-y_2))+|y_2+t(y_1-y_2)|^2 &\ge |x_2|^2-2(x_2,y_2)+|y_2|^2 \\ |x_2|^2-2(x_2,y_2)-2t(x_2,y_1-y_2)+|y_2|^2+2(y_2,t(y_1-y_2))+t^2|y_1-y_2|^2 & \ge |x_2|^2-2(x_2,y_2)+|y_2|^2 \\ -2t(x_2,y_1-y_2)+2t(y_2,(y_1-y_2))+t^2|y_1-y_2|^2 & \ge 0 \end{split}\end{equation}

下の式も添え字 1,2 を入れ替えれば同じ結果を得ます。辺々加えると、

\begin{equation}\begin{split} -2t(x_2,y_1-y_2)-2t(x_1,y_2-y_1) &=-2t(x_2,y_1-y_2)+2t(x_1,y_1-y_2) \\ &=2t(x_1-x_2,y_1-y_2) \end{split}\end{equation}

および

\begin{equation}\begin{split} 2t(y_2,y_1-y_2)+2t(y_1,y_2-y_1)&= 2t(y_2,y_1-y_2)-2t(y_1,y_1-y_2) \\ &= 2t(y_2-y_1,y_1-y_2) \\ &= -2t|y_1-y_2|^2 \end{split}\end{equation}

より

\begin{equation} 2t(x_1-x_2,y_1-y_2)-2t|y_1-y_2|^2 +2t^2|y_1-y_2|^2 \ge 0\end{equation}

を得ます。 0 \le t \le 1 は任意であったから、 2t \gt 0 で両辺を割り  t \to 0 とすれば、

\begin{equation} (x_1-x_2,y_1-y_2)-|y_1-y_2|^2 \ge 0\end{equation}

すなわち

\begin{equation} |y_1-y_2|^2 \le (x_1-x_2,y_1-y_2) \le |x_1-x_2||y_1-y_2| \end{equation}

を得ます。 y_1 \neq y_2 ならば |y_1-y_2| \le |x_1-x_2| を得ますが、これは y_1=y_2 でも成立します。また、この評価から x_1=x_2 ならば y_1=y_2 が分かります。すなわちこれは

\begin{equation} |x-y| = \min_{z \in \Omega}|x-z| \end{equation}

なる y \in \Omega の一意性を意味します。ゆえに y=g(x) \in \Omega と書くことができ、さらに上の評価式から |g(x_1)-g(x_2)| \le |x_1-x_2| すなわち g \in C(\overline{B}:\Omega) が分かります。また、特に x \in \Omega ならば、

\begin{equation} \min_{z \in \Omega}|x-z|=0 \end{equation}

より g(x)=x であることに注意します。

 

さて、いま f \in C(\Omega:\Omega) であるとします。このとき

\begin{equation} f \circ g: \overline{B} \to \Omega \subset \overline{B}, \quad  (f \circ g)(x)=f(g(x))\end{equation}

はwell-definedであり、かつ  f\circ g \in C(\overline{B}:\overline{B}) です。実際、  x \in \overline{B} に対して g(x) \in \Omega であり、 f \in C(\Omega:\Omega) より (f\circ g)(x)=f(g(x)) \in \Omega \subset \overline{B} です。したがって f\circ g はwell-definedであり、また f,g の連続性から  f\circ g \in C(\overline{B}:\overline{B}) を得ます。したがってこの条件下では既に不動点の存在が示されているので、 (f\circ g)(x^*)=x^* なる x^* \in \overline{B} が存在します。ここで  x \in \overline{B} に対して (f\circ g)(x) \in \Omega であるから、 x^* \in \Omega が分かります。このとき先に注意したことから g(x^*)=x^* であり、したがって

\begin{equation} f(x^*)=f(g(x^*))=(f \circ g)(x^*)=x^* \end{equation}

となり、 f \in C(\Omega:\Omega) に対する不動点 x^* \in \Omega を得ます。これで定理が完全に示されました。

 

いやはやなかなか大変でした!!証明は増田著「非線形数学」に載っています。証明はなかなか難しく、不動点の存在を背理法で示すわけですがそのために関数やらなんやらたくさん定義して、さらにそのJacobi行列式積分を計算するという、なんでこんな手法を思いついたのかよくわからない証明です。

 

一方で凸集合上での証明はなかなか技巧的ですごいなぁと思いました。閉球での結果を凸集合でいうために最短距離を与える点の一意性を言ったわけですが、これが凸集合のポイントですかね。例えば凸でない場合は、Cのような形をした集合の中心の点を考えれば、Cの境界に触れるような等距離の点が複数存在してしまいますから、一意性が言えないわけです。これもどうやってこんな方法を思いついたかは分かりませんが、けっこう証明を見ていて感動しましたね。

 

さて、今回はBrouwerの不動点定理を示しましたが、Euler方程式での結果をいうためには、無限次元でも成立するSchauderの不動点定理を証明したいです。こいつはBrouwerの結果を使えば今回ほど証明は難航しないと思いますので、また機会があれば書いていきます。それではまた!!よろしくお願いします。

修論発表したくないよぉ~

こんにちは。ひよこてんぷらです。

 

sushitemple.hatenablog.jp

 

なんとか大変な英語での修論執筆作業を終え、一息ついたと思ったのですが、すぐさま先生から「解析性もよろしく」と連絡が来ました。ヒェ……

 

今回の修論では方程式の解を構成しましたが、その解の性質はまだよく分かっていませんので、parameter trickという手法を用いて解の時間変数に関する解析性を示そうというのが目的です。そういうわけで、12月中旬にはこの問題に取り組んでいました。んで、先輩からのアドバイスも参考に頑張っていたのですが、どうも解の解析性は時間変数だけでなく空間変数に対しても適用できそうだということに気づいたので、少しよい結果が示せそうです。時間変数の解析性についてはDenkの方法があり、これを参考にしたのですが、後日Prüss-Simonettの方法では時空間解析性を同時に示せていたのでこれを参考にしました。

 

解の存在では非線形項の双線形評価が本質的な結果であり、これを用いて修論を執筆したわけですが、解析性は方程式の摂動問題(方程式に摂動というちょっと余計な項を含めた問題)を解ければよいので、これには先と同じ双線形評価がフルに活用できます。そういうわけでこちらの問題は1週間ちょいで解決しました。よかった。論文も大体同じようにかけばよいので大体書き終え、一安心。

 

そういうわけで12月中にいろいろ終えられて、ゆっくりと年末を過ごしていました。自宅でゲームしまくったり暇つぶしになんかご飯作ったりと楽しくやっていたのですが、修論執筆だけではどうも卒業できないようで、1月もなかなか大変でした……

 

さて、1月上旬から休み気分を切り替え、いろいろと卒業までの準備をしました。まずは講義の課題を済ませます。講義の課題は1月末まで大丈夫なのですが、後述の理由により早めに済ませることにしました。修士ではそんなに講義数も多くなく(同大学院進学のため先取り履修制度でだいぶ学部4年のうちに履修していた)、課題はまあ比較的すぐに片づけられました。

 

さて、1月が大変だった理由は、修論の学術誌投稿、修論発表の準備、解析性の論文の修正、博士課程の出願、奨学金の申請、TAの仕事などいろいろなことをしなければならなかったからです。

 

修論の学術誌投稿について。もとより先生から今回の論文は学術誌投稿に値するということでがんばって英語で書きました。そういうわけで学術誌に投稿しようとしたわけですが、先生から「やり方は先輩に聞いてね~」と指示されいきなり修論を投稿することに!え、どうすりゃいいの!?

 

とりあえず投稿先は先生が指定してくれたものの、いきなり投稿といわれてもわけがわからなかったため先輩にいろいろ聞きながらなんとか理解しました。とりあえず投稿には投稿する論文のデータはもちろん、他にもCover Letterと呼ばれる書類を添付する必要があります。Cover Letterと調べると、外資系などの場合において、履歴書などと同封する自己アピールなどを記入した書類と出てくるわけですが、どうも先輩からはこの定型文で大丈夫だよと言われたので、少なくともこの界隈ではCover Letterはあくまで形式上の書類のようです。他にも投稿者の情報として氏名や住所(これは大学の住所でよい)、所属などを記入したり、論文のジャンル、基本情報などを指定して電子で送信。郵送の場合もあるようですが、電子はすぐに投稿できるので便利でいいですね。

 

もちろん投稿が完了しても学術誌に載るかは分かりません。査読者による査読(投稿した論文が学術誌掲載に値するかを審議)を経て、アクセプトされれば学術誌に載るようです。この査読期間は長いと1年以上かかることもあるようで、つまり論文を書いてから誰もが閲覧できるような状態になるまでそれだけの期間を要するということです。大変ですね。

 

ちなみに、論文の投稿時に担当する編集者を自分で決めることができます。編集者は論文に掲載するか否かの最終的な判断を担う重要なポジションであり、したがって慎重に選ぶ必要があります。しかし自分で決めるのはなかなか難しく、先生や先輩から指示をいただきました。一応編集者の専攻分野も確認できるので、そういった情報から決めることもできますが、編集者次第で学術誌に載るかどうかが決まるので、どうせならやさしい編集者を選びたいですよね……ここらへんは経験値の差が出るのかなと思います。なお、編集者と査読者は別で、編集者は選べても査読者は選べません。そして誰が査読したのかは分かりません。怖いです。

 

また、運悪くリジェクトされた場合は、残念ながら掲載はされませんので、また別の学術誌を探して再度査読してもらいます。もちろん1から査読することになるのでまた時間がかかります……大変です。

 

 

さて、次に修論の発表。やだなぁ……

 

修論は書いてなんとか早期修了の許可も得ましたが、まだ修論の単位自体をもらえたわけではありません。修論の単位をもらうためには修論の提出に加え発表をしなければなりません。修論発表は偉い先生方の前でがんばって15分発表を行い、その後5分間の質疑応答ラッシュを凌ぎます。このときHPが残っていれば勝利、殺されればゲームオーバーです。また、今回はコロナのため特別にZoomを使用するようです。

 

もちろん発表のためには発表用の資料、つまりスライドを用意しなければなりません。通常発表用スライドといえばpower pointによるスライドですが、どうもこの界隈ではBeamerと呼ばれる環境を使います。やはりTeXのソースに応じたスライドが作成できる点がよいのでしょうか?BeamerはTeX環境があれば簡単に作成できます。ただ使ったことがなかったので先輩の資料やアドバイスを参考になんとか作成しました。

 

いやはやこれがなかなか大変で、今回の修論の結果を15分にまとめなければなりません。当然スライドもできるだけ少なくするべく頑張る必要があります。先生からは理想は8ページといわれましたが、まあ無理ですね。11ページになりました。まずスライドに載せる内容としてタイトル、導入、先行研究、主結果は必要になります。あとは主結果の証明ですが、当然必要なら補題などを紹介します。これがどうやって8ページに収まるか?無理です。まあ今回は先生からまあそのくらいでいいでしょうと許可をいただいたので、これでいくことにします。

 

んで、当然発表練習も頑張ります。15分に内容を収めるのもなかなか難しいです。今回は自分でしっかり理解して論文を書いたので、別に修論の内容を発表できないということはないのですが、基本はカンペを読むことは推奨されないので、頭の中で内容をしっかり整理して15分に収める必要があります。また内容もただ発表するだけではダメです。例えばスライドに評価式を書いた際も「こういう評価が成立します」とか評価式をそのまま読み上げるだけとかではダメで、「こういう評価が成立しますが、ここでこの評価から〇〇の場合は××になることが分かります」とか「この評価は〇〇なら××ということを意味しています」など、相手にこちらの意図が効率よく伝わるようにうまく発表する必要があります。他にも「なぜこの条件が必要なのか?」「なぜこの補題を用意するのか?」「なぜこの場合は示せていないのか?」などの情報を添えて分かりやすく発表をするように頑張ります。先生からは「何を発表するのかではなく、何を削るのかを意識せよ」とアドバイスをもらいました。頑張ります。

 

一応何度か練習をしまして、時間はまあまあいい感じに収められてますが、まだいくつか分かりやすく発表できるポイントがあるようで、少しずつ改良を加えながら頑張ってます。ただまあ正直もう発表したいな……という気持ちでいっぱいです。早くこのもやもやした気持ちから解放されたい……

 

解析性の論文の修正について。先ほど述べたように12月中に解析性の論文を書きましたが、先生からいくつか指摘をされまして、それについて話し合いをしました。初めは空間変数の解析性がダメなのでは?と急に電話がかかってきてビビりましたが、なんとか後日話し合いをして大丈夫そうだということになりました。あの時はビビった……しかしながら、どうも空間変数の解析性ではどのBanach空間上で言えるか(だいたいは時間変数に関するL^{\infty} classで)に言及したほうがいいとの指摘を受けまして、後日詳しく議論して修正する予定です。

 

博士課程の出願について。修士課程を早期修了する場合は、前提として博士課程への出願が必要になります。そういうわけで出願するわけですが、これが1月中ということでわりとすぐバタバタしてました。早期修了での出願なので何か特殊な事情があるかな~といろいろ確認したかったわけですが、修論書くのが大変で、12月でやっと終わったと思ったらそこから年末年始は大学閉室で事務所にも尋ねられないということで、大学のホームページ等で調べてから書類を用意して、念のため出願前に確認。たぶん大丈夫だと思います。その他早期修了の場合は本来修士2年次で履修する研究授業+修士論文の単位を申請する必要があるらしく、ここについても事務所に確認。コロナで担当者不在ということで問い合わせフォーム等で確認し、なんとかなりました。結論からいうと今回は先生からの申請で大丈夫らしく、学生は何も手続きは必要ないとのことでした。ここらへんもどうなるかわからず少し緊張しながら手続きを行いました。先日博士面接の連絡がきたので、おそらく出願は受理されたかと思います。ふう……

 

奨学金の申請について。通常、博士課程の学生は学振(日本学術振興会)からの支援金をもらうべく、修士2年の段階でいろいろと書類を整えて、無事この申請が通れば博士課程入学と同時に支援金がもらえるようです。ただ、早期修了した場合はこのタイミングを逃してしまうので、学振への応募は1年遅れて申請が通れば博士2年から支援金をいただけるということになります。そこで、先生がその点を配慮していただいて、他の奨学金の紹介を行ってくれました。ただ、もちろん博士課程入学から博士2年までの間に受給されるということで、その申請書類を用意しなければなりません。締め切りが1月末ということで、急いで奨学金申請の書類を用意しました。書類には基本的な個人情報に加え、これまでの研究成果とこれからの研究計画を記入せねばなりません。学振も似たような書類をかかなければならないということで、いい練習だと思って頑張って書類を記入しました。これで無事通れば、学振申請までの1年間に受給を受けながら研究ができます。先生、ありがとうございます……

 

ちなみに学振に関しては、どうも申請の通過率は2割ほどらしく、かなり難関だそうです。また、博士入学時点の受給プランはDC1と呼ばれ、途中からのはDC2と呼ばれるようです。そしてDC2のほうがやや申請が難しいらしく、不安が残ります……大丈夫かな……

 

学振の申請は今回の奨学金とは比べ物にならないほど大変で、1~2か月ほどかけて書類を用意するようです。先ほどの研究成果、研究計画をより詳細に記述します。先行研究の紹介で具体的に論文を参照するなど、論文を書くレベルで苦労するようなので、大変そうです……とはいえ、学振に通れば、月20万程度の生活費と年間150万の研究費を支援してもらえるようです。数学の研究費って何に使うんだろうか……と思いますが、基本は学会などの出張費、そして数学書などの購入や、他にもプリンターやパソコンなどに充てられるようです。あとは研究のお手伝いとして研究補助者を雇うこともできるようです。要するに研究費からバイト代を捻出する、みたいな感じでしょうか。

 

最後にTAの仕事ですね。これまでにレポートの採点をしていたので、当然講義終了近くには最終レポートがあり、その採点です。普通に自分の講義の最終課題と時期が被るので、修論の発表準備その他もろもろと合わせてけっこう1月中旬は忙しかったです……

 

そういうわけで、さて修論が執筆できたからとゆっくり年末を過ごしてたら、けっこう1月中にも怒涛のタスクが残っており、まあまあ大変でした……ちなみに今はもうだいたい片付いたので、後は修論の発表準備を頑張るのみです。修論の発表が終われば晴れて解放!!……といいたいわけですが、そうもいきません。ヒィ……

 

修論の発表が終われば新たな論文に取り組みます。次はKeller-Segel方程式のparabolic-elliptic typeの考察です。今回はparabolic-parabolic typeでの考察だったため、これと同様の議論を行います。なお、parabolic-ellipticに関しては実は岩渕氏による先行研究(Global well-posedness for Keller-Segel system in Besov type spaces)があります。今回考えようとしているscale不変な斉次Besov空間上での解の存在です。ところがこの研究手法はmild solutionを介した証明であり、前に述べたようにこの場合では解の一意性classに時間変数の連続性くらいを課さないといけないため、maximal Lorentz regularityを用いた場合では一意性classに時間Lorentz class程度を課せば済む分だけ優位性があると思われます。そういうわけでこの解の存在証明と、また時空間解析性を示したいと思います。ちなみにその次の研究も予定がありまして、Euler方程式とのcouplingを考えようと思っています。Navier-Stokesとのcouplingは既に考えられているようですので、より難しいEuler方程式で考えてみることにします。

 

それから、なんとびっくりですが、講演の依頼をいただいたのでその準備もしなければなりません。修論の発表は15分間ですが、今回の講演は30分!!内容は修論と同じもの以外今のところは発表できないのでそのつもりでいますが、時間が増える分より詳細にスライドを作成し、また練習しなければなりません。まだまだ発表には慣れないので、とにかく頑張るしかなさそうです……ヒェ

 

この講演もZoomで行います。ドキドキで緊張しますが、他大学の学生も参加されるとのことで、もしかしたら自分の講演のクオリティ次第では他大学の学生や教授にいいアピールをできるかもしれないということで、なんとか好印象を持ってもらえるように頑張りたいです。

 

そしてその後は先ほど述べた学振の準備です。5月あたりに書類を出すということで、余裕をもって準備しておきたいです。申請通過率が2割程度しかないということで、何とかして頑張りたいです。これがもらえるだけでも今後の精神的な負担が軽くなると思うので、それまでに書類にかける業績を積んでおきたいと思います。頑張ります。

 

とまあそういうことでして、割とハードな感じになりそうです。まあいろいろあるとはいいましたが、別に徹夜するほど業務に追われているということでもないので、精神的な負担にさえ耐えられればたぶんなんとかなります。無理せず頑張ってよい博士スタートができればよいなと思っています。しかしそれにしても、修論発表したくないなぁ……

delta関数はBesov空間に属するらしい

こんにちは。ひよこてんぷらです。修論が終わりました。

 

さて、修論は初期値が斉次Besov空間における微分方程式の解の存在と一意性を言ったわけですが、どうも初期値空間として斉次Besov空間を選ぶとdelta関数などの特異点を含む関数に対しても解が構成できるそうです。

 

いちおうこの根拠を見てみましょう。いろいろ調べてみましたが、どうもdelta関数は斉次Besov空間、より詳しくは \dot{B}_{p,\infty}^{-n+n/p}(\mathbb{R}^n) に属するらしいです。delta関数が超関数なのは周知の事実ですが、思ってみればdelta関数は非常にシンプルな構造ですから、超関数という広すぎるclassにとどまらず、もっと強い特徴付け(=より狭いclassに属する)ができるはずですよね。しかし先に述べたことは本当なのかな??ということで調べてみました。

 

まずは斉次Besov空間の定義についてですが、Littlewood Paley分解というものを用います。まず、

\begin{align} A = \left\{\xi \in \mathbb{R}^n \ \left| \ \frac{1}{2} < |\xi| < 2\right.\right\} \end{align}
に対して、次の条件
\begin{align} \mathrm{supp}\varphi =\overline{A} , \ \ \ \varphi >0 \ \ \ \mathrm{in} \ A , \ \ \ \sum_{j=-\infty}^{\infty}\varphi\left(\frac{1}{2^j}\xi\right)=1 \ \ \ {}^{\forall}\xi \in \mathbb{R}^n \setminus \{0\} \end{align}

を満たすような急減少関数 \varphi \in \mathscr{S} が存在します。これを認めましょう。このときLittlewood Paley分解はFourier変換 \mathcal{F} を用いて

\begin{align} \varphi_j(x) = \mathcal{F}^{-1}\left[\varphi\left(\frac{1}{2^j}\xi\right)\right](x) \end{align}
と定義されます。これを用いて斉次Besov空間は

\begin{align} \dot{B}_{p,q}^s(\mathbb{R}^n) = \{f \in \mathscr{S}^* \ | \ \|f\|_{\dot{B}_{p,q}^s}<\infty\} \end{align}

\begin{align} \|f\|_{\dot{B}_{p,q}^s(\mathbb{R}^n)} = \left\{\begin{array}{ll}
\displaystyle \left\{\sum_{j=-\infty}^{\infty}(2^{sj}\|\varphi_j*f\|_{L^p(\mathbb{R}^n)})^q\right\}^{\frac{1}{q}} & 1 \le q <\infty \\
\displaystyle \sup_{j \in \mathbb{Z}}\left\{2^{sj}\|\varphi_j*f\|_{L^p(\mathbb{R}^n)}\right\} & q=\infty
\end{array}\right. \end{align}

と定義されます。ここで \mathscr{S}^* は急減少関数の空間の双対、つまり緩増加超関数の集合です。また斉次Besov空間においては多項式の空間の商空間を考えることもありますが、これはnormの性質を保つためです( \|f\|_{\dot{B}_{p,q}^s(\mathbb{R}^n)}=0 ならば f多項式)。

 

さて、定義を確認したところで、  \delta \in \dot{B}_{p,\infty}^{-n+n/p}(\mathbb{R}^n) を示してみましょう。 q=\infty におけるnormを計算してみます。まず

\begin{align} (\varphi_j*\delta)(x)=\int_{\mathbb{R}^n} \varphi_j (y)\delta (x-y)dy=\varphi_j (x) \end{align}

に注意します。これはdelta関数の定義から分かることです。これを見て、なるほどdelta関数というのはconvolutionにおける単位元のような役割をしているのか!と感心しました。思えば当たり前なことなんですけどね。次にこれの L^p normを計算します。まあ急減少関数やし逆Fourier変換しても可積分やろ!と思っていたわけですが、引数に注意する必要があるため、ここまで話は単純ではありません。少し注意しながら計算してみましょう。変数変換 \xi=2^j\xi' に対して d\xi=2^{nj}d\xi' に注意して、

\begin{eqnarray*} \varphi_j(x) &=&  \mathcal{F}^{-1}\left[\varphi\left(\frac{1}{2^j}\xi\right)\right](x) \\ &=& \frac{1}{2\pi i}\int_{\mathbb{R}^n} e^{ix\cdot \xi}\varphi\left(\frac{1}{2^j}\xi\right)d\xi \\ &=& \frac{1}{2\pi i}\int_{\mathbb{R}^n} e^{2^jix\cdot \xi'}\varphi (\xi') 2^{nj}d\xi' \\ &=& 2^{nj}\mathcal{F}^{-1}[\varphi](2^jx) \end{eqnarray*}

を得ます。これの L^p normを計算するわけですから、再び変数変換 x'=2^jx により

\begin{eqnarray*} \|\varphi_j\|_{L^p(\mathbb{R}^n)}^p &=& \int_{\mathbb{R}^n} |\varphi_j(x)|^p dx \\ &=& \int_{\mathbb{R}^n} 2^{pnj}|\mathcal{F}^{-1}[\varphi](2^jx)|^pdx \\ &=& \int_{\mathbb{R}^n} 2^{pnj}|\mathcal{F}^{-1}[\varphi](x')|^p2^{-nj}dx' \\ &=& 2^{pnj-nj}\|\mathcal{F}^{-1}[\varphi]\|_{L^p(\mathbb{R}^n)}^p \end{eqnarray*}

が分かります。もちろん \varphi は急減少関数なので逆Fourier変換しても可積分性はへっちゃらです。でも引数の変数変換でいろいろと 2 のべき乗が出てくることには注意しましょう。さて、ここまでくれば定義にしたがって計算できます。

\begin{eqnarray*} \|\delta\|_{\dot{B}_{p,\infty}^s(\mathbb{R}^n)} &=& \sup_{j \in \mathbb{Z}}\left\{ 2^{sj}\|\varphi_j*\delta\|_{L^p(\mathbb{R}^n)} \right\} \\ &=& \sup_{j \in \mathbb{Z}}\left\{ 2^{sj}\|\varphi_j\|_{L^p(\mathbb{R}^n)} \right\} \\ &=& \sup_{j \in \mathbb{Z}}\left\{ 2^{sj}2^{nj-\frac{n}{p}j}\|\mathcal{F}^{-1}[\varphi]\|_{L^p(\mathbb{R}^n)} \right\} \\ &=& \|\mathcal{F}^{-1}[\varphi]\|_{L^p(\mathbb{R}^n)}\sup_{j \in \mathbb{Z}}2^{\left( s+n-\frac{n}{p} \right)j} \end{eqnarray*}

さて、このnormが有限になるためにはどうすればよいか?ここで指数 s=-n+n/p が決まります。したがってこのときnormは有限となり、  \delta \in \dot{B}_{p,\infty}^{-n+n/p}(\mathbb{R}^n) が示されるというわけです。

 

なるほどつまり可微分性を決定しているのは変数変換において 2 のべき乗を処理しているところであって、次元 n に依存するわけだ!そんで2回目の変換では L^p normを計算するから 1/p 乗がされるということか!よくわかりました。さらに p はなんでもよいわけですから、例えば p=1 とすれば \delta \in \dot{B}_{1,\infty}^0(\mathbb{R}^n) が分かります。実際に計算してみるとけっこうおもしろいですね。また、微分階数は適当なRiesz potentialなどで持ち上げることができます。すなわち (-\Delta)^{-\frac{1}{2}s}\delta \in \dot{B}_{p,\infty}^{s-n+n/p}(\mathbb{R}^n) であり、 (-\Delta)^{-\frac{1}{2}\left(s+n-n/p\right)}\delta \in \dot{B}_{p,\infty}^s(\mathbb{R}^n) というわけです。なるほどこういうわけで斉次Besov空間上で偏微分方程式が解ければ初期値として特異点を持つような関数も考えられるってことですね。

 

修論、事の顛末Part3

こんにちは。ひよこてんぷらです。修論についてです。前回はこんな感じでした。

 

 

sushitemple.hatenablog.jp

 

ここでは、「解の構成があと少しでできそう。その後は解析性をがんばるぞ」という趣旨の話をしていました。

 

ところがどっこい、解の構成ができたという話を11月の中旬あたりに指導教官の先生に話したところ、「じゃあこれで論文書きましょうか」と言われました。

 

…………………………え!?!?

 

びっくりです。いやだってまだ僕修士1年ですよ!?!?まだ解析性やってませんよ!?!?と。

 

どうも解析性まで言わなくても解の存在と一意性だけで十分論文にはなるらしいです。

 

そんで、同時に「このまま頑張れば早期修了(=修士1年で修士課程を卒業)できるけど、その場合は博士進学が必須なので、博士、どう?」とのお誘いを受けました。

 

いや~~~~~~~~~~どうしよっかなぁと。

 

もともと博士課程への進学予定がゼロだったわけではありませんが、就活を今の今までまったくやってなかったので、自分としては修士2年で就活やってそんで最後に進学か就職か決めるかという感じだったわけですが、こういうワケでまさかの今進学か就職かを決めるということに……1週間後にこの答えを聞かせてくださいと。

 

まいったなぁ……どうしよう。

 

でもまあせっかく早期修了できるなら、このステータスはどこかで役に立つだろうし、まあ進学するか……と決めました。

 

しかしながらそうはいってもこれで進学が決まったわけではありません。あくまで「頑張れば早期修了できる」とのことですので、頑張らなきゃいけません。結果自体は出ていても、早期修了のためには修論を書かなければなりません。また、先生から「内容は専門誌に投稿できるレベルなので英語で書いてね」と。

 

無理だ。

 

僕はTOEIC400点レベルの英語力です。大学入試ではロト6パワーでねじ伏せました。当然英語は書けません。

 

しかも修論にはただ計算結果をかくのみならず、なぜこのような問題を考えるのか、どうしてこのような方法で計算したのか、過去の研究結果(先行研究)と比較して何が新しく得られたか、どこが優れているかなど、いろいろなものを書かなければなりません。え?自分で計算したんならそんくらいかけるでしょと思うかもしれませんが、自分は先生からこういう問題を解いてみないかと提案されたテーマに取り組んだだけなので、自発的に研究テーマを設定したわけではありません。だからどうしてこういう問題を考えたとか、どこが優れているかなどは正直意識せず計算していました。

 

そういうわけで、修論としての研究内容を考えたうえで、それを英語にして書かなければなりません。

 

さて、期限は?

 

12月中旬です。

 

無理だ。

 

3週間程度で英語で修論を書かなければならないわけです(ギリギリに出すわけにもいかないので実質はもう少し短い)。いやさすがに無理やろ。

 

3週間もあれば書けるでしょ?と思うかもしれませんが、僕は論文を書いたことがないですから、もうどうすりゃいいか分かりません。まだ書いた経験が1度でもあれば自分で進んで書けるかもしれませんが、そんな経験値はありません。ゼロです。

 

しかも先生も忙しいので週に1~2回くらいのペースでしか僕の修論をチェックしてくれるチャンスがありません。だからそれまでのタイミングでできる限りの情報を詰め込み、先生から助言をもらわねばなりません。

 

いや~~もう人生おしまいだぁと思い、食欲も減退し死にそうになりました。

 

でも出せました。

 

唯一僕の修論を定期的にチェックしてくれて英語の修正や内容の書き方などめちゃくちゃアドバイスしてくれた先輩がいてくれたおかげで助かりました。先輩がいなかったら確実に間に合っていませんでした。本当にありがとうございます……

 

さて、せっかくですので少し振り返りましょう。

 

まず研究内容は放物型Keller Segel方程式の解の存在と一意性です。既に示されてはいるのですが、先行研究は初期値の空間として弱  L^p 空間や BMO (有界関数より少し広い)などをとり、mild solution(微分方程式積分方程式に直したやつの解)を経て解を得ています。それに対して僕の手法はmaximal Lorentz regularityという最大正則性を用いた手法(これは既にNavier Stokes方程式に対して用いられている手法です)を使って斉次Besov空間上における解の存在と一意性を示しました。初期値の空間に直接的な包含関係はないものの、Besov空間での証明ができたおかげで初期値として特異点を持つ(例えばdelta関数など)ような場合でも解を構成することができます。さらにmild solutionを介さずに解を構成できるため、証明がより簡潔で一意性のclassも広くとれます(mild solutionでは一意性classに時間連続性を課すが、僕の場合は必要ない)。

 

んでKeller Segel方程式というのは1970年代にKellerとSegelによって導入された化学走性の数理モデルです。細菌がある化学物質に向かって集まるような習性を化学走性(略して走化性とも)といいます。特に偏微分方程式論において重要なscale不変性について考えられたのは2000年近くで、つまりこの方程式の数学的研究はまだ20年ほどしかされていない非常にトレンディなものです。先行研究も、まったく同じ方程式での解析はほとんどありません(放物型Keller Segel方程式でなく楕円型のものもあります。これはNagai modelとよばれるやつで、この研究はいくつかされています。しかし方程式としては放物型のほうが難しいです)。しかもmaximal Lorentz regularityによる偏微分方程式への応用は2019年の論文であり、めっちゃ新しいです。つまり僕の研究は新しい方程式に新しい手法を使っためっちゃ新しい理論です。

 

要するに僕の研究は運の良さの塊です。たぶん僕が研究した結果は僕がいなくても確実に数年以内に同じ結果(あるいはもっと洗練された結果)が出されていたと思います。たまたま新しい方程式、新しい手法ができたおかげでその波に乗れたという感じです。

 

というか純粋数学における結果を出すのはめちゃ難しいですから、こういう新しい理論が登場してくれないと僕みたいな数学素人が証明できる問題が残りません。逆に昔からよく知られていてかつ解かれていない問題はめっちゃ難しいものしか残ってないわけですから、数学においても自然科学における新しい発見(=数学理論に輸入できそうな新たな概念を見つけること)は重要です。そういう面では、物理学と親和性の高い解析学分野はラッキーです。自然科学が発展して新たな数理モデルが導入されれば、それらはすべて偏微分方程式として解析分野の問題になるわけですね。それに比べれば抽象論である関数解析の研究はより難しい(=自然科学からの影響をあまり受けないので新たな問題が発見されにくい)と思います。個人的な意見ですが……

 

さて、論文には何を書いたかというと、偏微分方程式論において重要なscale不変性について説明しました。scale不変の理論は藤田加藤によるNavier Stokes方程式への理論が起源であり、これをもとに初期値空間の取り方としてscale不変なものを選ぼう、という自然な流れができました。どうしてscale不変な空間だとうまくいくのかについては、あまり僕は理解していません……(笑)

 

んで、先行研究の説明です。先にも述べたように、あまり先行研究は多くなく、しかもmild solutionによる考察なので、最大正則性から直接解を得た自分の結果のほうに優位性があります。

 

次に、主な解の手法を説明します。maximal Lorentz regularityは、熱半群の評価およびよく知られている最大正則性に対して実補間を用いて得られる評価です。これを熱方程式に対して適用させます。実際の偏微分方程式に対しては、熱方程式に帰着させるように逐次近似法を用いて解を構成します。

 

最後に、研究課題を述べます。今後示したいこととして、解の解析性、摂動に対する安定性、そして時間に対する解の挙動などを述べました(先生が提案してくれたわけですが)。

 

こういう流れをよく理解して、今後論文を書く時の参考にしたいですね。まあたぶんまだ無理ですけど……

 

それから先生から指摘された点についても振り返ります。

 

まず「任意の」は「for all」ですが、命題などで「任意の~に対して次が成立する」などの場合は「for every」だそうです。また、「~が成立する」として「it holds that」「it follows that」などがありますが、そこに「~より」という根拠を加える場合は「it holds by ~ that」「it follows from ~ that」などとするそうです。「it holds from ~ that」はあまり使わないらしいです。「derive」の場合は「be derived from」だそうです。

 

定理、補題、命題はこの順に「強い」主張です。弱い主張には命題を用います。

 

表記を簡略化する目的で記号を導入することはあまり推奨されません(場合にもよる)。多少式が複雑になってもそのまま書いたほうがいいそうです。

 

省略する「abbreviate」例:「In the following, we will abbreviate L^p(\mathbb{R}^n)=L^p.」

~に由来する「stem from」例:「The crucial point stems from the analysis of the heat equation.」

~を意味する「imply」例:「We have by induction that |a_n| \le 1/n for all n \in \mathbb{N}, which implies that \lim_{n \to \infty}|a_n|=0.」

これは「yield」に変えても可

 

ここらへんに関しては数学の論文特有の技術です。たぶんすぐには慣れないだろうけどがんばって習慣化します。

 

とまあ、こんな感じでここ2週間ほどは激動でしたが、なんとかなりました。死にそうでした。

 

でまあ今はつかの間の休息をとりまして、残りの解析性の問題に取り組みたいと思います。

 

解析性も今はちょいと悩んでいます。普通に解が1つなら抽象論のparameter trickでなんとかなりますが、解が2つ(放物型Keller Segel方程式は解が2成分ある)だと陰関数定理を使うと解の変数として残りの解も出てきてしまうので、これは大丈夫なのかな??というところが疑問です。今は作戦として解のscale変換を1つの解に対してのみ適用し、残りの解はそのままの既知関数としてしまえば問題ないかな?という感じです。ただしこの場合は解析性を示すために2回陰関数定理を使う必要があり、つまり2つ微分方程式を解かなきゃダメっぽいです。

 

まあここらへんの話はまたぼちぼちしていこうかと思います。

 

とりあえず修論が終わったことをほめてほしいです。つかれました。あとは博士に対する不安が残ります。留学いきたくないよぅ……

修論がなんかいい感じに進んでる話Part2

こんにちは。ひよこてんぷらです。前回は修論がやばいという話をしました。

 

sushitemple.hatenablog.jp

 

でも逆に今はいい感じです。まだLorentz空間もBesov空間も最大正則性もなにがなんだかよくわかってないのにいきなり応用の微分方程式が出てきてかなり意気消沈していましたが、2,3週間くらいじっくりと取り組んでいるうちに、なんとなく分かってきました。前回はいわゆる「なにがわからないかわからない」という暗闇の中をさまよっていた状態ですが、いまは「なにがわからないかわかる」状態にまでなりました。あとはこつこつと勉強すればいい感じになりそうです。

 

とりあえず問題についてもう一度振り返りますと、放物型Keller Segel方程式

\begin{align}
\left\{\begin{array}{rll}
\partial_tu &=\Delta u-\nabla \cdot (u\nabla v) & x \in \mathbb{R}^n , \ t>0 \\
\partial_tv &=\Delta v -\gamma v+u & x \in \mathbb{R}^n , \ t>0 \\
u(0,x) &= u_0(x) & x \in \mathbb{R}^n \\
v(0,x) &= v_0(x) & x \in \mathbb{R}^n
\end{array}\right. \tag{KS}
\end{align}

を考えます。  u=u(t,x) , v=v(t,x) が未知関数で  \gamma \ge 0 は定数です。前回は関数 u,v をそれぞれ
\begin{align}u : t \mapsto u(t,x) , \ \ \ v : t \mapsto v(t,x)\end{align}
とみなし、また
\begin{align}w = \left(\begin{array}{c}
u \\
v
\end{array}\right) , \ \ \ w_0 = \left(\begin{array}{c}
u_0 \\
v_0
\end{array}\right) , \ \ \ F_{\gamma}(w) = \left(\begin{array}{c}
-\nabla \cdot(u\nabla v) \\
-\gamma v+u
\end{array}\right)\end{align}
とおくことで、(KS)を
\begin{equation}
\partial_tw-\Delta w=F_{\gamma}(w) \ \ \ t>0 , \ \ \ w(0)=w_0 \tag{ABS}
\end{equation}

の形に帰着させました。2変数でもvectorにして1変数で処理しちゃえばいいやと思ってたのですが、後の非線形項の評価の都合上やはりそれぞれの方程式について考えたほうがよさそうです。あと \gamma=0 とします( \gamma を考慮するほうが方程式は一般化されますが、 \gamma=0 のときは第2方程式の作用素がLaplacian \Delta となり、これは原点をresolventに含まないため一般には \gamma \gt 0 のときと比べ方程式の解析は難しくなります。したがってより難しい場合に絞って解析します)。すなわち

\begin{equation}
\left\{\begin{array}{rlll}
\partial_tu-\Delta u &=-\nabla \cdot (u\nabla v) & t>0 & u(0)=u_0 \\
\partial_tv-\Delta v &=u & t>0 & v(0)=v_0
\end{array}\right. \tag{ABS}
\end{equation}

を考えようということです。

 

で、前回は初期データが  (u_0,v_0) \in \dot{B}^{-2+n/p}_{p,q} \times \dot{B}^0_{\infty,q} の場合を考えるといいましたが、これをやめにして  (u_0,v_0) \in \dot{B}^{-2+n/p}_{p,q} \times \dot{B}^{n/p'}_{p',q'} の場合を考えることにします。なんでかというと、無限だとダメだったからです。あとLorentz classは独立でOKらしいです。つまり解の空間として

\begin{align*} L^{\alpha,q}((0,T):X \times Y) \end{align*}

みたいなのを考えてましたけど

\begin{align*} L^{\alpha,q}((0,T):X) \times L^{\alpha',q'}((0,T):Y) \end{align*}

という形でよいみたいです。そういうわけで q も同じ値でなくてよいみたいです。

 

そもそも  (u_0,v_0) \in \dot{B}^{-2+n/p}_{p,q} \times \dot{B}^{n/p'}_{p',q'} とはどっから出てきたのかというと、scaleの都合上らしいです。ざっくり説明すると、scale変換した解のnormが不変となるような場合を考えようということみたいです。解のscale変換とは、ある方程式の解が得られたとき、その解の時間変数や空間変数を、適当なparameterでscale変換するなどの操作を行うことです。方程式によっては、任意のparameterに対して、このような変換を施した関数もまたもとの方程式の解となる場合があります。そこで、そのような解のnormをとったとき、通常はscale変換時のparameterによって解のnormが変動しますが、関数空間を適当に選び、このnormがparameterによらず不変となる場合を考えます。このような関数空間はひとつに限りませんが、それを考えると自然に  (u_0,v_0) \in \dot{B}^{-2+n/p}_{p,q} \times \dot{B}^{n/p'}_{p',q'} がでてきます。初めに考えた  (u_0,v_0) \in \dot{B}^{-2+n/p}_{p,q} \times \dot{B}^0_{\infty,q}p'=\infty の場合に相当します。こうすることで微分回数が 0 になるので、初期値の可微分性を仮定せずに解を構成できますが、これがのちにダメということが分かってしまいました。

 

原因は、解の評価にあります。前回も作戦を述べたように、まずは熱方程式を解析してあとでKeller Segelの場合を考えるわけですが、この熱方程式の最大正則性を考える段階でアウトだったわけです。最大正則性は初期値ナシの非斉次項アリの場合で使うので、まずは初期値アリの非斉次項ナシの場合を調べます。つまり

\begin{equation*}
\left\{\begin{array}{rlll}
\partial_tu-\Delta u &=0 & t>0 & u(0)=u_0 \\
\partial_tv-\Delta v &=0 & t>0 & v(0)=v_0
\end{array}\right.
\end{equation*}

を評価します。この場合は解は熱半群で表されるので、こいつを評価します。この評価は次のようになります。

 

 s,s' \in \mathbb{R} , \ 1 \le p \le r \le \infty , \ 1 \le p' \le r' \le \infty , \ 1 \le q,q' \le \infty および正の \alpha,\alpha'

\begin{align*} -4+\frac{n}{p}<s, \ \ \ -2+\frac{n}{p'}<s' \end{align*}
および
\begin{align*} \frac{1}{\alpha}=\frac{1}{2}s-\frac{n}{2r}+2 , \ \ \ \frac{1}{\alpha'}=\frac{1}{2}s'-\frac{n}{2r'}+1 \end{align*}
を満たすとします。このとき正の定数 C が存在して

\begin{align*} u_0 \in \dot{B}^{-2+n/p}_{p,q} , \ v_0 \in \dot{B}^{n/p'}_{p',q'} \end{align*}
に対して
\begin{eqnarray*}
\|\Delta e^{t\Delta}u_0\|_{L^{\alpha,q}((0,\infty):\dot{B}_{r,1}^s)} &\le& C\|u_0\|_{\dot{B}^{-2+n/p}_{p,q}} \\
\|\Delta e^{t\Delta}v_0\|_{L^{\alpha',q'}((0,\infty):\dot{B}_{r',1}^{s'})} &\le& C\|v_0\|_{\dot{B}^{n/p'}_{p',q'}}
\end{eqnarray*}

 

この評価はあとで最大正則性を使ってから非斉次項&初期値アリの評価に一緒に用いられます。つまりこのときの評価の空間

\begin{align*} L^{\alpha,q}((0,\infty):\dot{B}_{r,1}^s) , \ \ \ L^{\alpha',q'}((0,\infty):\dot{B}_{r',1}^{s'}) \end{align*}

が後の最大正則性の評価にも用いたいということになります。この評価において初めの初期データの空間  (u_0,v_0) \in \dot{B}^{-2+n/p}_{p,q} \times \dot{B}^0_{\infty,q} を考えたいとなると、 p'=\infty にするわけですが、このとき変数の条件から r'=\infty が自動的に決まります。したがって

\begin{align*} L^{\alpha,q}((0,\infty):\dot{B}_{r,1}^s) , \ \ \ L^{\alpha',q}((0,\infty):\dot{B}_{\infty,1}^{s'}) \end{align*}

が後の最大正則性の評価に用いたいということになります。でもこれはダメです。なぜかというと、最大正則性は基本的にUMDという空間に対してしか適用できません。UMDは必要条件ではないですが、UMDでない空間の議論はややこしくなるので、とりあえずはUMDの場合で考えたいです。ところで回帰的でない空間はUMDではありません。んで \dot{B}_{\infty,1}^{s'} はどうかというと、アウトです。 L^1,L^{\infty} が回帰的でないのと同様に、これはダメです。したがって最大正則性をすぐに使えないわけです。そういうわけで p' \neq \infty として  (u_0,v_0) \in \dot{B}^{-2+n/p}_{p,q} \times \dot{B}^{n/p'}_{p',q'} を考えようということになりました。

 

さて、さらにこの間にけっこう進捗をうみまして、いまはいい感じになっています。とりあえず熱方程式の解析はできたので、いよいよKeller Segel方程式の解析をします。なぜ熱方程式を先に解析したかというと、熱方程式の評価からKeller Segel方程式を解析するという作戦でいくからです。もう少し詳しく話すと、まず次の方程式

\begin{equation}
\left\{\begin{array}{rlll}
\partial_tu-\Delta u &=-\nabla \cdot (u\nabla v)+f & \mathrm{in} \ (0,T) & u(0)=u_0 \\
\partial_tv-\Delta v &=u+g & \mathrm{in} \ (0,T) & v(0)=v_0
\end{array}\right. \tag{ABS}
\end{equation}

を考えるわけですが、熱方程式

\begin{equation}
\left\{\begin{array}{rlll}
\partial_tu-\Delta u &=f & \mathrm{in} \ (0,T) & u(0)=u_0 \\
\partial_tv-\Delta v &=g & \mathrm{in} \ (0,T) & v(0)=v_0
\end{array}\right. \tag{HE}
\end{equation}

が解ければ、熱方程式の解を U^*,V^* とするときKeller Segel方程式の解を u=U^*+U , \ v=V^*+V の形で探せば

\begin{equation}
\left\{\begin{array}{rlll}
\partial_tU-\Delta U &=-\nabla \cdot ( (U^*+U)\nabla (V^*+V) ) & \mathrm{in} \ (0,T) & U(0)=0 \\
\partial_tV-\Delta V &=U+U^* & \mathrm{in} \ (0,T) & V(0)=0
\end{array}\right.
\end{equation}

を解けばよいということになります。さて、この方程式ですが、熱方程式の解 U^*,V^* は既知なのでよいですが、右辺にある U,V が邪魔です。そこで次のように考えます。

\begin{equation}
\left\{\begin{array}{rlll}
\partial_tU_0-\Delta U_0 &= -\nabla \cdot (U^*\nabla V^*) & \mathrm{in} \ (0,T) & U_0(0)=0 \\
\partial_tV_0-\Delta V_0 &= U^* & \mathrm{in} \ (0,T) & V_0(0)=0
\end{array}\right.
\end{equation}
および j \ge 0 に対して
\begin{equation}
\left\{\begin{array}{rlll}
\partial_tU_{j+1}-\Delta U_{j+1} &= -\nabla \cdot ( (U^*+U_j) \nabla (V^*+V_j) ) & \mathrm{in} \ (0,T) & U_{j+1}(0)=0 \\
\partial_tV_{j+1}-\Delta V_{j+1} &=U^*+U_j & \mathrm{in} \ (0,T) & V_{j+1}(0)=0
\end{array}\right.
\end{equation}

とします。こう考えれば、まず U_0,V_0 は右辺が既知の U^*,V^* のみなので熱方程式として考えることができます。さらに帰納的に U_j,V_j の解が見つかれば漸化式のほうも右辺は既知となり熱方程式に帰着されます。さらにこの解の列がうまく収束すればそれが解となりそうです。これが熱方程式の評価を使いたい理由です。

 

しかし、この作戦においては1つ大掛かりな主張を示さねばなりません。それはこれらの右辺の項

\begin{align*} -\nabla \cdot (U^*\nabla V^*) , \ \ \ U^* , \ \ \ -\nabla \cdot ( (U^*+U_j) \nabla (V^*+V_j) ) , \ \ \ U^*+U_j \end{align*}

の評価です。熱方程式の評価は最大正則性により成立しています。したがって非斉次項はLorentz classに属する必要があります。そういうわけで、うまく帰納法が回り解の評価ができるためには右辺の項の評価が大事になります。特に非線形項の評価がキモで、もはや可解性はこの主張を示せるかどうかにかかっているわけです。

 

で、この評価についてですが、うまくいきそうです!!かなり泥臭い計算が必要ですが、結構いい感じに示せそうです。これが終わればほぼ方程式は解けたも同然なので、けっこう嬉しいです。

 

そういうわけで今後はこの評価と解の構成をがんばります。なお、目標は解の構成だけでなくその解析性も示そうとしていますので、解が構成できた段階では目標の半分は到達できたと思っていいと思います。いやー、がんばったな!!

 

また進捗がうまれば何かつづっていきます。頑張ろう!!