Schauderの不動点定理について
こんにちは。ひよこてんぷらです。今回はSchauderの不動点定理を示します。証明にはBrouwerの不動点定理を用います。
Brouwerの不動点定理は、有界な凸集合 に対して ならば なる が存在する(一意的とは限らない)という定理です。これに関しては、前回の記事を参照してください。
さて、ではSchauderの不動点定理を示しましょう。まず、凸包の定義を与えます。集合 に対して、その凸包 を、 を含む最小の凸集合と定義します。ここで、 が有限個の点列の集まりの場合、すなわち と表すことができる場合、
\begin{equation} \mathrm{Conv} \, \Omega=\mathrm{Conv} \, \{\xi_j\}_{j=1}^m =\left\{ \left. \sum_{j=1}^m \alpha_j\xi_j \, \right| \, \alpha_j \ge 0 \quad \mathrm{and} \quad \sum_{j=1}^m \alpha_j=1 \right\} \end{equation}
が成立します。
Schauderの不動点定理は、 をnorm空間とし、 を空でない凸集合、 をcompactとするとき、次が成立するという定理です。
(i) 任意の に対して、ある有限個の点列 と写像 が存在して、任意の に対して が成立する
(ii) 任意の に対して なる が存在する
(i)の はSchauder射影作用素と呼ばれ、不動点定理を示すために重要なアイテムです。なお、(ii)が不動点定理の主張ですね。ここで、Brouwerの不動点定理は に対する不動点定理だったので有限次元上での定理ですが、Schauderの不動点定理はnorm空間で示せるので無限次元上での不動点の存在です。関数解析の基本は無限次元空間上の議論ですから、無限次元においても不動点が言えるのは嬉しいことです。
なお、Schauderの不動点定理として、仮定は を凸集合としていますが、 自身がcompactな凸集合ならば、 とでき、したがって に対して不動点の存在が言えます。こちらをSchauderの不動点定理とすることもあります。
では早速主張を示していきましょう。まず(i)を示します。 をとり、開球
\begin{equation} B\left(x,\frac{1}{2}\varepsilon\right) = \left\{ y \in X \, \left| \, \|y-x\|_X \lt \frac{1}{2}\varepsilon \right.\right\} \end{equation}
を考えます。次の開被覆
\begin{equation} K \subset \bigcup_{x \in K} B\left(x,\frac{1}{2}\varepsilon\right) \end{equation}
に対して、 がcompactであることから、有限個の解被覆で
\begin{equation} K \subset \bigcup_{j=1}^{m_{\varepsilon}} B\left(\xi_j^{(\varepsilon)},\frac{1}{2}\varepsilon\right) \end{equation}
とできます。
さて、ここで に対して次の関数
\begin{equation} \mu_j(x)=\max\left\{ 1-\frac{2}{\varepsilon}\|x-\xi_j^{(\varepsilon)}\|_X,0 \right\} , \quad \mu(x)=\sum_{j=1}^{m_{\varepsilon}}\mu_j(x) \end{equation}
を考えます。明らかに であり、また、 が成立します。実際、次の等式
\begin{equation} \max\{a,0\}=\frac{1}{2}(|a|+a) \end{equation}
に注意すれば、
\begin{equation}\begin{split} \max\{a,0\}-\max\{b,0\} &=\frac{1}{2}(|a|+a)-\frac{1}{2}(|b|+b) \\ &=\frac{1}{2}(|a|-|b|+a-b) \\ &\le \frac{1}{2}(|a-b|+|a-b|) \\ &=|a-b| \end{split}\end{equation}
であり、 を入れ替えれば
\begin{equation} |\max\{a,0\}-\max\{b,0\}| \le |a-b| \end{equation}
を得ます。したがって、 に対して
\begin{equation}\begin{split} |\mu_j(x)-\mu_j(y)| &=\left| \max\left\{ 1-\frac{2}{\varepsilon}\|x-\xi_j^{(\varepsilon)}\|_X,0 \right\}-\max\left\{ 1-\frac{2}{\varepsilon}\|y-\xi_j^{(\varepsilon)}\|_X,0 \right\} \right| \\ &\le \left| \left( 1-\frac{2}{\varepsilon}\|x-\xi_j^{(\varepsilon)}\|_X \right)-\left( 1-\frac{2}{\varepsilon}\|y-\xi_j^{(\varepsilon)}\|_X \right) \right| \\ &= \frac{2}{\varepsilon}\left| \|x-\xi_j^{(\varepsilon)}\|_X-\|y-\xi_j^{(\varepsilon)}\|_X \right| \\ &\le \frac{2}{\varepsilon}\|x-y\|_X \end{split}\end{equation}
より のとき すなわち を得ます。さらに、任意の に対して が成立します。実際、 ならば
\begin{equation} K \subset \bigcup_{j=1}^{m_{\varepsilon}} B\left(\xi_j^{(\varepsilon)},\frac{1}{2}\varepsilon\right) \end{equation}
に注意して、ある に対して
\begin{equation} x \in B\left(\xi_j^{(\varepsilon)},\frac{1}{2}\varepsilon\right) \end{equation}
ですが、これは
\begin{equation} \|x-\xi_j^{(\varepsilon)}\|_X \lt \frac{1}{2}\varepsilon \end{equation}
すなわち
\begin{equation} \mu_j(x)=\max\left\{ 1-\frac{2}{\varepsilon}\|x-\xi_j^{(\varepsilon)}\|_X,0 \right\} \gt 0 \end{equation}
を意味します。
\begin{equation} \mu(x)=\sum_{j=1}^{m_{\varepsilon}}\mu_j(x) , \quad \mu_j(x) \ge 0 \end{equation}
より1つでも なる があれば となります。ゆえに、次の関数
\begin{equation} \lambda_j : K \to \mathbb{R}, \quad \lambda_j(x) = \frac{\mu_j(x)}{\mu(x)} \end{equation}
はwell-definedです。さらに、任意の に対して かつ かつ
\begin{equation} \sum_{j=1}^{m_{\varepsilon}} \lambda_j(x)=\sum_{j=1}^{m_{\varepsilon}} \frac{\mu_j(x)}{\mu(x)}=\frac{\sum_{j=1}^{m_{\varepsilon}}\mu_j(x)}{\mu(x)}=\frac{\mu(x)}{\mu(x)}=1 \end{equation}
が成立します。いよいよSchauder射影作用素 を与えましょう。次の作用素
\begin{equation} P_{\varepsilon}: K \to \mathrm{Conv} \, \{\xi_j^{(\varepsilon)}\} , \quad P_{\varepsilon}x = \sum_{j=1}^{m_{\varepsilon}}\lambda_j(x)\xi_j^{(\varepsilon)} \end{equation}
はwell-definedであり、また が成立します。実際、 に対して
\begin{equation} \lambda_j(x) \ge 0 , \quad \sum_{j=1}^{m_{\varepsilon}}\lambda_j(x)=1 , \quad \lambda_j \in C(K) \end{equation}
であるから、初めに注意したように有限個の点列の凸包は
\begin{equation} \mathrm{Conv} \, \{\xi_j^{(\varepsilon)}\} =\left\{ \left. \sum_{j=1}^{m_{\varepsilon}} \alpha_j\xi_j^{(\varepsilon)} \, \right| \, \alpha_j \ge 0 \quad \mathrm{and} \quad \sum_{j=1}^{m_{\varepsilon}} \alpha_j=1 \right\} \end{equation}
と表されることに注意して、
\begin{equation} P_{\varepsilon}x = \sum_{j=1}^{m_{\varepsilon}}\lambda_j(x)\xi_j^{(\varepsilon)} \in \mathrm{Conv} \, \{\xi_j^{(\varepsilon)}\} \end{equation}
を得ます。また、 に対して
\begin{equation} \begin{split} \|P_{\varepsilon}x-P_{\varepsilon}y\|_X &=\left\| \sum_{j=1}^{m_{\varepsilon}}\lambda_j(x)\xi_j^{(\varepsilon)}-\sum_{j=1}^{m_{\varepsilon}}\lambda_j(y)\xi_j^{(\varepsilon)} \right\|_X \\ &=\left\| \sum_{j=1}^{m_{\varepsilon}}\{\lambda_j(x)-\lambda_j(y)\}\xi_j^{(\varepsilon)} \right\|_X \\ &\le \sum_{j=1}^{m_{\varepsilon}}|\lambda_j(x)-\lambda_j(y)|\|\xi_j^{(\varepsilon)}\|_X \\ &\le \max_{1 \le j \le m_{\varepsilon}}|\lambda_j(x)-\lambda_j(y)|\sum_{j=1}^{m_{\varepsilon}}\|\xi_j^{(\varepsilon)}\|_X \end{split}\end{equation}
であるから、 より のとき であり、 を得ます。ゆえに を得ます。
最後に、 に対して となることを見ましょう。
\begin{equation} \sum_{j=1}^{m_{\varepsilon}}\lambda_j(x)=1 \end{equation}
に注意して、
\begin{equation} P_{\varepsilon}x-x=\sum_{j=1}^{m_{\varepsilon}}\lambda_j(x)\xi_j^{(\varepsilon)} -\sum_{j=1}^{m_{\varepsilon}}\lambda_j(x)x=\sum_{j=1}^{m_{\varepsilon}}\lambda_j(x)(\xi_j^{(\varepsilon)}-x) \end{equation}
を得ます。したがって、
\begin{equation} \|P_{\varepsilon}x-x\|_X \le \sum_{j=1}^{m_{\varepsilon}}\lambda_j(x)\|\xi_j^{(\varepsilon)}-x\|_X \end{equation}
となるわけですが、もし
\begin{equation} \|\xi_j^{(\varepsilon)}-x\|_X \gt \frac{1}{2}\varepsilon \end{equation}
ならば
\begin{equation} \mu_j(x)=\max\left\{ 1-\frac{2}{\varepsilon}\|x-\xi_j^{(\varepsilon)}\|_X,0 \right\} = 0 \end{equation}
だから、このとき となります。したがって のときは常に
\begin{equation} \|\xi_j^{(\varepsilon)}-x\|_X \le \frac{1}{2}\varepsilon \end{equation}
を満たすので、
\begin{equation} \|P_{\varepsilon}x-x\|_X \le \sum_{j=1}^{m_{\varepsilon}}\lambda_j(x)\|\xi_j^{(\varepsilon)}-x\|_X \le \frac{1}{2}\varepsilon \sum_{j=1}^{m_{\varepsilon}}\lambda_j(x) \lt \varepsilon \end{equation}
を得ます。以上で(i)が証明されました。
さて、では(i)を用いて(ii)を示しましょう。さっそく(i)を用います。任意の正の整数 に対して、有限個の点列 およびSchauder射影作用素 が存在して、
\begin{equation} \|P_nx-x\|_X \lt \frac{1}{n} \end{equation}
が任意の に対して成立します。この正の整数 はあとで極限 を考えるため、少し見づらいですが に依存する関数や集合はすべて添え字 を付けておきます。
さて、ここで に注意します。実際、 であるから、凸包を与える作用は単調であることより、 が成立します。ここで、仮定から は凸集合であったから、凸集合自身の凸包は自分自身、すなわち です。ゆえに が成立します。
さて、ここで集合 を
\begin{equation} S_n=\left\{ s=(s_1,\ldots,s_{m_n}) \in \mathbb{R}^{m_n} \, \left| \, s_j \ge 0 \quad \mathrm{and} \quad \sum_{j=1}^{m_n}s_j=1 \right.\right\} \end{equation}
と定義すると、これは有界な凸閉集合です。有界性と凸性を確認します。有界性は
\begin{equation} |s|^2=\sum_{j=1}^{m_n}s_j^2 \le \left(\sum_{j=1}^{m_n}s_j\right)^2=1 \end{equation}
より分かります。凸性は、任意の2点 を結ぶ線分 もまた 上にあればよいですが、これは に注意すれば、 および
\begin{equation} \sum_{j=1}^{m_n}\{ \theta t_j+(1-\theta)s_j \}=\theta \sum_{j=1}^{m_n} t_j+(1-\theta)\sum_{j=1}^{m_n}s_j=\theta+(1-\theta)=1 \end{equation}
より直ちに示されます。したがって は有界な凸閉集合であり、Brouwerの不動点定理における仮定を満たすことに注意します。
ここで、次の作用素
\begin{equation} J_n:S_n \to \mathrm{Conv} \, \{\xi_j^{(n)}\} , \quad J_ns = \sum_{j=1}^{m_n}s_j\xi_j^{(n)} \end{equation}
はwell-definedであり、かつ となります。実際、先に示したことと同様に、有限個の点列に対する凸包の表式
\begin{equation} \mathrm{Conv} \, \{\xi_j^{(n)}\} =\left\{ \left. \sum_{j=1}^{m_n} \alpha_j\xi_j^{(n)} \, \right| \, \alpha_j \ge 0 \quad \mathrm{and} \quad \sum_{j=1}^{m_n} \alpha_j=1 \right\} \end{equation}
に注意すれば、 の定義から直ちに に対して
\begin{equation} J_ns = \sum_{j=1}^{m_n}s_j\xi_j^{(n)} \in \mathrm{Conv} \, \{\xi_j^{(n)}\} \end{equation}
を得ます。また に対して
\begin{equation}\begin{split} \|J_ns-J_nt\|_X &=\left\| \sum_{j=1}^{m_n}s_j\xi_j^{(n)}-\sum_{j=1}^{m_n}t_j\xi_j^{(n)} \right\|_X \\ &= \left\| \sum_{j=1}^{m_n}(s_j-t_j)\xi_j^{(n)} \right\|_X \\ &\le \sum_{j=1}^{m_n}|s_j-t_j|\|\xi_j^{(n)}\|_X \\ &\le |s-t| \sum_{j=1}^{m_n}\|\xi_j^{(n)}\|_X\end{split}\end{equation}
なので、 のとき を得ます。したがって を得ます。
さて、いよいよ不動点の存在を示します。ここで不動点の存在をいいたい をとります。次に、関数 を、(i)の証明時に定義した関数 を用いて
\begin{equation} g_n:S_n \to S_n , \quad g_n(s)=( (\lambda_1 \circ f \circ J_n)(s), \ldots, (\lambda_{m_n} \circ f \circ J_n)(s) ) \end{equation}
とすると、これはwell-definedであり、また となります。実際、初めに注意したことから であり、また
\begin{equation} J_n \in C(S_n:\mathrm{Conv} \, \{\xi_j^{(n)}\}) , \, f \in C(\Omega:K) , \, \lambda_j \in C(K) \end{equation}
に注意すれば、任意の に対して であり、ゆえに です。したがって は定義可能で、 の性質から任意の に対して
\begin{equation} \lambda_j(x) \ge 0, \quad \sum_{j=1}^{m_{\varepsilon}} \lambda_j(x)=1 \end{equation}
が成立します。したがって の定義から
\begin{equation} g_n(s)=( (\lambda_1 \circ f \circ J_n)(s), \ldots, (\lambda_{m_n} \circ f \circ J_n)(s) ) \in S_n \end{equation}
が分かります。また、連続関数の合成はまた連続であるから、 です。
さて、ここでBrouwerの不動点定理を用います。先ほど注意したように は有界な凸閉集合であり、Brouwerの不動点定理の仮定を満たします。ゆえに は不動点をもちます。したがって を満たすような が存在します。この は(i)で現れる任意の正の整数でしたから、関数列 に応じた不動点の点列 を得ます。この点列は ですから 次元vectorであり、この 成分を とかくと、
\begin{equation} g_n(s^{(n)})=( (\lambda_1 \circ f \circ J_n)(s^{(n)}), \ldots, (\lambda_{m_n} \circ f \circ J_n)(s^{(n)}) )=s^{(n)} \end{equation}
の 成分は で与えられます。さて、Schauder射影作用素の定義は、任意の に対して
\begin{equation} P_nx = \sum_{j=1}^{m_n}\lambda_j(x)\xi_j^{(n)} \end{equation}
であったことに注意すると、上の等式から
\begin{equation} P_nf(J_ns^{(n)})=\sum_{j=1}^{m_n}\lambda_j(f(J_ns^{(n)}))\xi_j^{(n)}=\sum_{j=1}^{m_n}s_j^{(n)}\xi_j^{(n)}=J_ns^{(n)} \end{equation}
を得ます。最後の等式は の定義です。
さて、点列 に対して であり、また初めに注意したことから なので、点列 を で定義すれば です。また上式から を得ます。ここで、仮定から は に対して を与えることに注意します。初めに(i)を用いて任意の に対して
\begin{equation} \|P_nx-x\|_X \lt \frac{1}{n} \end{equation}
が成立していたから、これを用いれば
\begin{equation} \|x^{(n)}-f(x^{(n)})\|_X=\|P_nf(x^{(n)})-f(x^{(n)})\|_X \lt \frac{1}{n} \end{equation}
が分かります。さて、 かつ がcompactであることから、点列compactの定義より適当な部分列 を選べばこの部分列は収束します。これを としましょう。すなわち
\begin{equation} \|f(x^{(n_j)})-x\|_X \to 0 \quad (j \to \infty) \end{equation}
が成立します。これが求める不動点です。以下、これを確かめましょう。
上の式に注意して、
\begin{equation}\begin{split} \|x^{(n_j)}-x\|_X &\le \|x^{(n_j)}-f(x^{(n_j)})\|_X+\|f(x^{(n_j)})-x\|_X \\ &\le \frac{1}{n_j}+\|f(x^{(n_j)})-x\|_X \\ &\to 0 \quad (j \to \infty) \end{split}\end{equation}
を得るから、
\begin{equation} \|f(x)-x\|_X \le \|f(x)-f(x^{(n_j)})\|_X+\|f(x^{(n_j)})-x\|_X \end{equation}
とすれば右辺第1項は から、 に収束します。ゆえに不動点 の存在が示されました。
これがSchauderの不動点定理です。なかなか証明が大変でしたね。証明を追ってもどうやってこういうアプローチを思い浮かべたのかはよく分かりません。しかしながらSchauder射影作用素が非常に重要であることは分かります。無限次元であるSchauderを示すのに有限次元でのBrouwerをうまく使いたいわけですが、ここでSchauder射影作用素が効いています。無限次元空間でのすべての元に対して、その有限個の点列の凸包でもって不等式を成立させていますから、これによって有限個の点列から有限次元でのBrouwerの結果を使えるようにするわけです。なかなか考えましたね……
Banachの不動点定理では縮小写像という、写像に非常に強い制限を課していますが、Schauderは集合をcompactにすることで、写像はただの連続性だけでよいという非常にゆるい仮定において使えるというのがよいですね。
さて、これでやっと不動点定理が示せたので、さっそくこの不動点定理を用いて微分方程式を解いてみたいと思います。がんばるぞ~~
今回も見てくださってありがとうございます。