Schauderの不動点定理について

こんにちは。ひよこてんぷらです。今回はSchauderの不動点定理を示します。証明にはBrouwerの不動点定理を用います。

 

Brouwerの不動点定理は、有界な凸集合 \Omega \subset \mathbb{R}^n に対して f \in C(\Omega:\Omega) ならば f(x)=x なる  x \in \Omega が存在する(一意的とは限らない)という定理です。これに関しては、前回の記事を参照してください。

 

sushitemple.hatenablog.jp

 

さて、ではSchauderの不動点定理を示しましょう。まず、凸包の定義を与えます。集合 \Omega に対して、その凸包 \mathrm{Conv} \, \Omega を、 \Omega を含む最小の凸集合と定義します。ここで、 \Omega が有限個の点列の集まりの場合、すなわち \Omega=\{\xi_j\}_{j=1}^m と表すことができる場合、

\begin{equation} \mathrm{Conv} \, \Omega=\mathrm{Conv} \, \{\xi_j\}_{j=1}^m =\left\{ \left. \sum_{j=1}^m \alpha_j\xi_j \, \right| \, \alpha_j \ge 0 \quad \mathrm{and} \quad \sum_{j=1}^m \alpha_j=1 \right\} \end{equation}

が成立します。

 

Schauderの不動点定理は、 X をnorm空間とし、  \Omega \subset X を空でない凸集合、 K \subset \Omega をcompactとするとき、次が成立するという定理です。

(i) 任意の \varepsilon \gt 0 に対して、ある有限個の点列  \{\xi_j^{(\varepsilon)}\}=\{\xi_j^{(\varepsilon)}\}_{j=1}^{m_{\varepsilon}} \subset K写像  P_{\varepsilon} \in C(K: \mathrm{Conv} \, \{\xi_j^{(\varepsilon)}\} ) が存在して、任意の x \in K に対して  \|P_{\varepsilon}x-x\|_X \lt\varepsilon が成立する

(ii) 任意の f \in C(\Omega:K) に対して f(x)=x なる x \in \Omega が存在する

 

(i)の P_{\varepsilon} はSchauder射影作用素と呼ばれ、不動点定理を示すために重要なアイテムです。なお、(ii)が不動点定理の主張ですね。ここで、Brouwerの不動点定理は \Omega \subset \mathbb{R}^n に対する不動点定理だったので有限次元上での定理ですが、Schauderの不動点定理はnorm空間で示せるので無限次元上での不動点の存在です。関数解析の基本は無限次元空間上の議論ですから、無限次元においても不動点が言えるのは嬉しいことです。

 

なお、Schauderの不動点定理として、仮定は \Omega を凸集合としていますが、 \Omega 自身がcompactな凸集合ならば、 K=\Omega とでき、したがって f \in C(\Omega:\Omega) に対して不動点の存在が言えます。こちらをSchauderの不動点定理とすることもあります。

 

では早速主張を示していきましょう。まず(i)を示します。 \varepsilon \gt 0 をとり、開球

\begin{equation} B\left(x,\frac{1}{2}\varepsilon\right) = \left\{ y \in X \, \left| \, \|y-x\|_X \lt \frac{1}{2}\varepsilon \right.\right\} \end{equation}

を考えます。次の開被覆

\begin{equation} K \subset \bigcup_{x \in K} B\left(x,\frac{1}{2}\varepsilon\right) \end{equation}

に対して、 K がcompactであることから、有限個の解被覆で

\begin{equation} K \subset \bigcup_{j=1}^{m_{\varepsilon}} B\left(\xi_j^{(\varepsilon)},\frac{1}{2}\varepsilon\right) \end{equation}

とできます。

 

さて、ここで 1 \le j \le m_{\varepsilon} , \, x \in K に対して次の関数

\begin{equation} \mu_j(x)=\max\left\{ 1-\frac{2}{\varepsilon}\|x-\xi_j^{(\varepsilon)}\|_X,0 \right\} , \quad \mu(x)=\sum_{j=1}^{m_{\varepsilon}}\mu_j(x) \end{equation}

を考えます。明らかに \mu_j(x) , \mu(x) \ge 0 であり、また、 \mu_j,\mu \in C(K) が成立します。実際、次の等式

\begin{equation} \max\{a,0\}=\frac{1}{2}(|a|+a) \end{equation}

に注意すれば、

\begin{equation}\begin{split} \max\{a,0\}-\max\{b,0\} &=\frac{1}{2}(|a|+a)-\frac{1}{2}(|b|+b)  \\ &=\frac{1}{2}(|a|-|b|+a-b) \\ &\le \frac{1}{2}(|a-b|+|a-b|) \\ &=|a-b| \end{split}\end{equation}

であり、 a,b を入れ替えれば

\begin{equation} |\max\{a,0\}-\max\{b,0\}| \le |a-b| \end{equation}

を得ます。したがって、 x,y \in K に対して

\begin{equation}\begin{split} |\mu_j(x)-\mu_j(y)| &=\left| \max\left\{ 1-\frac{2}{\varepsilon}\|x-\xi_j^{(\varepsilon)}\|_X,0 \right\}-\max\left\{ 1-\frac{2}{\varepsilon}\|y-\xi_j^{(\varepsilon)}\|_X,0 \right\} \right| \\ &\le \left| \left( 1-\frac{2}{\varepsilon}\|x-\xi_j^{(\varepsilon)}\|_X \right)-\left( 1-\frac{2}{\varepsilon}\|y-\xi_j^{(\varepsilon)}\|_X \right) \right| \\ &= \frac{2}{\varepsilon}\left| \|x-\xi_j^{(\varepsilon)}\|_X-\|y-\xi_j^{(\varepsilon)}\|_X \right| \\ &\le \frac{2}{\varepsilon}\|x-y\|_X \end{split}\end{equation}

より \|x-y\|_X \to 0 のとき  |\mu_j(x)-\mu_j(y)| \to 0 すなわち \mu_j,\mu \in C(K) を得ます。さらに、任意の  x\in K に対して \mu(x) \gt 0 が成立します。実際、  x \in K ならば

\begin{equation} K \subset \bigcup_{j=1}^{m_{\varepsilon}} B\left(\xi_j^{(\varepsilon)},\frac{1}{2}\varepsilon\right) \end{equation}

に注意して、ある  1 \le j \le m_{\varepsilon} に対して

\begin{equation} x \in B\left(\xi_j^{(\varepsilon)},\frac{1}{2}\varepsilon\right) \end{equation}

ですが、これは

\begin{equation} \|x-\xi_j^{(\varepsilon)}\|_X \lt \frac{1}{2}\varepsilon \end{equation}

すなわち

\begin{equation} \mu_j(x)=\max\left\{ 1-\frac{2}{\varepsilon}\|x-\xi_j^{(\varepsilon)}\|_X,0 \right\} \gt 0 \end{equation}

を意味します。

\begin{equation} \mu(x)=\sum_{j=1}^{m_{\varepsilon}}\mu_j(x) , \quad \mu_j(x) \ge 0 \end{equation}

より1つでも  \mu_j(x) \gt 0 なる  1 \le j \le m_{\varepsilon} があれば \mu(x) \gt 0 となります。ゆえに、次の関数

\begin{equation} \lambda_j : K \to \mathbb{R}, \quad \lambda_j(x) = \frac{\mu_j(x)}{\mu(x)} \end{equation}

はwell-definedです。さらに、任意の x \in K に対して  \lambda_j(x) \ge 0 かつ  \lambda_j \in C(K) かつ

\begin{equation} \sum_{j=1}^{m_{\varepsilon}} \lambda_j(x)=\sum_{j=1}^{m_{\varepsilon}} \frac{\mu_j(x)}{\mu(x)}=\frac{\sum_{j=1}^{m_{\varepsilon}}\mu_j(x)}{\mu(x)}=\frac{\mu(x)}{\mu(x)}=1 \end{equation}

が成立します。いよいよSchauder射影作用素 P_{\varepsilon} を与えましょう。次の作用素

\begin{equation} P_{\varepsilon}: K \to \mathrm{Conv} \, \{\xi_j^{(\varepsilon)}\} , \quad P_{\varepsilon}x = \sum_{j=1}^{m_{\varepsilon}}\lambda_j(x)\xi_j^{(\varepsilon)} \end{equation}

はwell-definedであり、また P_{\varepsilon} \in C(K:\mathrm{Conv} \, \{\xi_j^{(\varepsilon)}\}) が成立します。実際、 x \in K に対して

\begin{equation} \lambda_j(x) \ge 0 , \quad \sum_{j=1}^{m_{\varepsilon}}\lambda_j(x)=1 , \quad \lambda_j \in C(K) \end{equation}

であるから、初めに注意したように有限個の点列の凸包は

\begin{equation} \mathrm{Conv} \, \{\xi_j^{(\varepsilon)}\} =\left\{ \left. \sum_{j=1}^{m_{\varepsilon}} \alpha_j\xi_j^{(\varepsilon)} \, \right| \, \alpha_j \ge 0 \quad \mathrm{and} \quad \sum_{j=1}^{m_{\varepsilon}} \alpha_j=1 \right\} \end{equation}

と表されることに注意して、

\begin{equation} P_{\varepsilon}x = \sum_{j=1}^{m_{\varepsilon}}\lambda_j(x)\xi_j^{(\varepsilon)} \in \mathrm{Conv} \, \{\xi_j^{(\varepsilon)}\} \end{equation}

を得ます。また、 x,y \in K に対して

\begin{equation} \begin{split} \|P_{\varepsilon}x-P_{\varepsilon}y\|_X &=\left\| \sum_{j=1}^{m_{\varepsilon}}\lambda_j(x)\xi_j^{(\varepsilon)}-\sum_{j=1}^{m_{\varepsilon}}\lambda_j(y)\xi_j^{(\varepsilon)} \right\|_X \\ &=\left\| \sum_{j=1}^{m_{\varepsilon}}\{\lambda_j(x)-\lambda_j(y)\}\xi_j^{(\varepsilon)} \right\|_X \\ &\le \sum_{j=1}^{m_{\varepsilon}}|\lambda_j(x)-\lambda_j(y)|\|\xi_j^{(\varepsilon)}\|_X \\ &\le \max_{1 \le j \le m_{\varepsilon}}|\lambda_j(x)-\lambda_j(y)|\sum_{j=1}^{m_{\varepsilon}}\|\xi_j^{(\varepsilon)}\|_X \end{split}\end{equation}

であるから、  \lambda_j \in C(K) より \|x-y\|_X \to 0 のとき |\lambda_j(x)-\lambda_j(y)| \to 0 であり、 \|P_{\varepsilon}x-P_{\varepsilon}y\|_X \to 0 を得ます。ゆえに P_{\varepsilon} \in C(K:\mathrm{Conv} \, \{\xi_j^{(\varepsilon)}\}) を得ます。

 

最後に、 x\in K に対して \|P_{\varepsilon}x-x\|_X \lt \varepsilon となることを見ましょう。

\begin{equation} \sum_{j=1}^{m_{\varepsilon}}\lambda_j(x)=1 \end{equation}

に注意して、

\begin{equation} P_{\varepsilon}x-x=\sum_{j=1}^{m_{\varepsilon}}\lambda_j(x)\xi_j^{(\varepsilon)} -\sum_{j=1}^{m_{\varepsilon}}\lambda_j(x)x=\sum_{j=1}^{m_{\varepsilon}}\lambda_j(x)(\xi_j^{(\varepsilon)}-x) \end{equation}

を得ます。したがって、

\begin{equation} \|P_{\varepsilon}x-x\|_X \le \sum_{j=1}^{m_{\varepsilon}}\lambda_j(x)\|\xi_j^{(\varepsilon)}-x\|_X \end{equation}

となるわけですが、もし

\begin{equation} \|\xi_j^{(\varepsilon)}-x\|_X \gt \frac{1}{2}\varepsilon \end{equation}

ならば

\begin{equation} \mu_j(x)=\max\left\{ 1-\frac{2}{\varepsilon}\|x-\xi_j^{(\varepsilon)}\|_X,0 \right\} = 0 \end{equation}

だから、このとき \lambda_j(x) = \mu_j(x)/\mu(x)=0 となります。したがって \lambda_j(x) \gt 0 のときは常に

\begin{equation} \|\xi_j^{(\varepsilon)}-x\|_X \le \frac{1}{2}\varepsilon \end{equation}

を満たすので、

\begin{equation} \|P_{\varepsilon}x-x\|_X \le \sum_{j=1}^{m_{\varepsilon}}\lambda_j(x)\|\xi_j^{(\varepsilon)}-x\|_X \le \frac{1}{2}\varepsilon \sum_{j=1}^{m_{\varepsilon}}\lambda_j(x) \lt \varepsilon \end{equation}

を得ます。以上で(i)が証明されました。

 

さて、では(i)を用いて(ii)を示しましょう。さっそく(i)を用います。任意の正の整数 n に対して、有限個の点列 \{\xi_j^{(n)}\}=\{\xi_j^{(n)}\}_{j=1}^{m_n} \subset K およびSchauder射影作用素 P_n \in C(K:\mathrm{Conv} \, \{\xi_j^{(n)}\} ) が存在して、

\begin{equation} \|P_nx-x\|_X \lt \frac{1}{n} \end{equation}

が任意の x \in K に対して成立します。この正の整数 n はあとで極限  n \to \infty を考えるため、少し見づらいですが n に依存する関数や集合はすべて添え字 n を付けておきます。

 

さて、ここで \mathrm{Conv} \, \{\xi_j^{(n)}\} \subset \Omega に注意します。実際、 \{\xi_j^{(n)}\} \subset K \subset \Omega であるから、凸包を与える作用は単調であることより、 \mathrm{Conv} \, \{\xi_j^{(n)}\} \subset \mathrm{Conv} \, K \subset \mathrm{Conv} \, \Omega が成立します。ここで、仮定から \Omega は凸集合であったから、凸集合自身の凸包は自分自身、すなわち \mathrm{Conv} \, \Omega=\Omega です。ゆえに \mathrm{Conv} \, \{\xi_j^{(n)}\} \subset \Omega が成立します。

 

さて、ここで集合 S_n \subset \mathbb{R}^{m_n}

\begin{equation} S_n=\left\{ s=(s_1,\ldots,s_{m_n}) \in \mathbb{R}^{m_n} \, \left| \, s_j \ge 0 \quad \mathrm{and} \quad \sum_{j=1}^{m_n}s_j=1 \right.\right\} \end{equation}

と定義すると、これは有界な凸閉集合です。有界性と凸性を確認します。有界性は

\begin{equation} |s|^2=\sum_{j=1}^{m_n}s_j^2 \le \left(\sum_{j=1}^{m_n}s_j\right)^2=1 \end{equation}

より分かります。凸性は、任意の2点 s,t \in S_n を結ぶ線分 s+\theta (t-s) \, (0 \le \theta \le 1) もまた S_n 上にあればよいですが、これは s+\theta (t-s)=\theta t+(1-\theta) s に注意すれば、 \theta t_j+(1-\theta)s_j \ge 0 および

\begin{equation} \sum_{j=1}^{m_n}\{ \theta t_j+(1-\theta)s_j \}=\theta \sum_{j=1}^{m_n} t_j+(1-\theta)\sum_{j=1}^{m_n}s_j=\theta+(1-\theta)=1 \end{equation}

より直ちに示されます。したがって S_n \subset \mathbb{R}^{m_n}有界な凸閉集合であり、Brouwerの不動点定理における仮定を満たすことに注意します。

 

ここで、次の作用素

\begin{equation} J_n:S_n \to \mathrm{Conv} \, \{\xi_j^{(n)}\} , \quad J_ns = \sum_{j=1}^{m_n}s_j\xi_j^{(n)} \end{equation}

はwell-definedであり、かつ  J_n \in C(S_n:\mathrm{Conv} \, \{\xi_j^{(n)}\}) となります。実際、先に示したことと同様に、有限個の点列に対する凸包の表式

\begin{equation} \mathrm{Conv} \, \{\xi_j^{(n)}\} =\left\{ \left. \sum_{j=1}^{m_n} \alpha_j\xi_j^{(n)} \, \right| \, \alpha_j \ge 0 \quad \mathrm{and} \quad \sum_{j=1}^{m_n} \alpha_j=1 \right\} \end{equation}

 に注意すれば、 S_n の定義から直ちに s \in S_n に対して

\begin{equation} J_ns = \sum_{j=1}^{m_n}s_j\xi_j^{(n)} \in \mathrm{Conv} \, \{\xi_j^{(n)}\} \end{equation}

を得ます。また s,t \in S_n に対して

\begin{equation}\begin{split} \|J_ns-J_nt\|_X &=\left\| \sum_{j=1}^{m_n}s_j\xi_j^{(n)}-\sum_{j=1}^{m_n}t_j\xi_j^{(n)} \right\|_X \\ &= \left\| \sum_{j=1}^{m_n}(s_j-t_j)\xi_j^{(n)} \right\|_X \\ &\le \sum_{j=1}^{m_n}|s_j-t_j|\|\xi_j^{(n)}\|_X \\ &\le |s-t| \sum_{j=1}^{m_n}\|\xi_j^{(n)}\|_X\end{split}\end{equation}

なので、 |s-t| \to 0 のとき \|J_ns-J_nt\|_X \to 0 を得ます。したがって J_n \in C(S_n:\mathrm{Conv} \, \{\xi_j^{(n)}\}) を得ます。

 

さて、いよいよ不動点の存在を示します。ここで不動点の存在をいいたい f \in C(\Omega:K) をとります。次に、関数 g_n を、(i)の証明時に定義した関数 \lambda_j を用いて

\begin{equation} g_n:S_n \to S_n , \quad g_n(s)=( (\lambda_1 \circ f \circ J_n)(s), \ldots, (\lambda_{m_n} \circ f \circ J_n)(s) ) \end{equation}

とすると、これはwell-definedであり、また  g_n \in C(S_n:S_n) となります。実際、初めに注意したことから \mathrm{Conv} \, \{\xi_j^{(n)}\} \subset \Omega であり、また

\begin{equation} J_n \in C(S_n:\mathrm{Conv} \, \{\xi_j^{(n)}\}) , \, f \in C(\Omega:K) , \, \lambda_j \in C(K) \end{equation}

に注意すれば、任意の s \in S_n に対して J_ns \in \mathrm{Conv} \, \{\xi_j^{(n)}\} \subset \Omega であり、ゆえに f(J_ns) \in K です。したがって (\lambda_j \circ f \circ J_n)(s)=\lambda_j(f(J_ns)) は定義可能で、 \lambda_j の性質から任意の x \in K に対して

\begin{equation} \lambda_j(x) \ge 0, \quad \sum_{j=1}^{m_{\varepsilon}} \lambda_j(x)=1 \end{equation}

が成立します。したがって S_n の定義から

\begin{equation} g_n(s)=( (\lambda_1 \circ f \circ J_n)(s), \ldots, (\lambda_{m_n} \circ f \circ J_n)(s) ) \in S_n \end{equation}

が分かります。また、連続関数の合成はまた連続であるから、  g_n \in C(S_n:S_n) です。

 

さて、ここでBrouwerの不動点定理を用います。先ほど注意したように S_n \subset \mathbb{R}^{m_n}有界な凸閉集合であり、Brouwerの不動点定理の仮定を満たします。ゆえに  g_n \in C(S_n:S_n)不動点をもちます。したがって g_n(s^{(n)})=s^{(n)} を満たすような s^{(n)} \in S_n が存在します。この n は(i)で現れる任意の正の整数でしたから、関数列 \{g_n\} \subset S_n に応じた不動点の点列 \{s^{(n)}\} \subset S_n を得ます。この点列は s^{(n)} \in S_n \subset \mathbb{R}^{m_n} ですから m_n 次元vectorであり、この j 成分を s_j^{(n)} とかくと、

\begin{equation} g_n(s^{(n)})=( (\lambda_1 \circ f \circ J_n)(s^{(n)}), \ldots, (\lambda_{m_n} \circ f \circ J_n)(s^{(n)}) )=s^{(n)}  \end{equation}

j 成分は (\lambda_j \circ f \circ J_n)(s^{(n)})=\lambda_j(f(J_ns^{(n)}))=s_j^{(n)} で与えられます。さて、Schauder射影作用素の定義は、任意の x \in K に対して

\begin{equation} P_nx = \sum_{j=1}^{m_n}\lambda_j(x)\xi_j^{(n)} \end{equation}

であったことに注意すると、上の等式から

\begin{equation} P_nf(J_ns^{(n)})=\sum_{j=1}^{m_n}\lambda_j(f(J_ns^{(n)}))\xi_j^{(n)}=\sum_{j=1}^{m_n}s_j^{(n)}\xi_j^{(n)}=J_ns^{(n)} \end{equation}

を得ます。最後の等式は J_n の定義です。

 

さて、点列 s^{(n)} \in S_n に対して J_ns^{(n)} \in \mathrm{Conv} \, \{\xi_j^{(n)}\} であり、また初めに注意したことから \mathrm{Conv} \, \{\xi_j^{(n)}\} \subset \Omega なので、点列 \{x^{(n)}\}x^{(n)}=J_ns^{(n)} で定義すれば \{x^{(n)}\} \subset \Omega です。また上式から P_nf(x^{(n)})=x^{(n)} を得ます。ここで、仮定から fx^{(n)} \in \Omega に対して f(x^{(n)}) \in K を与えることに注意します。初めに(i)を用いて任意の x \in K に対して

\begin{equation} \|P_nx-x\|_X \lt \frac{1}{n} \end{equation}

が成立していたから、これを用いれば

\begin{equation} \|x^{(n)}-f(x^{(n)})\|_X=\|P_nf(x^{(n)})-f(x^{(n)})\|_X \lt \frac{1}{n} \end{equation}

が分かります。さて、 \{f(x^{(n)})\} \subset K かつ K がcompactであることから、点列compactの定義より適当な部分列 \{f(x^{(n_j)})\} \subset K を選べばこの部分列は収束します。これを x \in K としましょう。すなわち

\begin{equation} \|f(x^{(n_j)})-x\|_X \to 0 \quad (j \to \infty) \end{equation}

が成立します。これが求める不動点です。以下、これを確かめましょう。

 

上の式に注意して、

\begin{equation}\begin{split} \|x^{(n_j)}-x\|_X &\le \|x^{(n_j)}-f(x^{(n_j)})\|_X+\|f(x^{(n_j)})-x\|_X \\ &\le \frac{1}{n_j}+\|f(x^{(n_j)})-x\|_X  \\ &\to 0 \quad (j \to \infty) \end{split}\end{equation}

を得るから、

\begin{equation} \|f(x)-x\|_X \le \|f(x)-f(x^{(n_j)})\|_X+\|f(x^{(n_j)})-x\|_X \end{equation}

とすれば右辺第1項は f \in C(\Omega:K) から、 0 に収束します。ゆえに不動点 f(x)=x の存在が示されました。

 

これがSchauderの不動点定理です。なかなか証明が大変でしたね。証明を追ってもどうやってこういうアプローチを思い浮かべたのかはよく分かりません。しかしながらSchauder射影作用素が非常に重要であることは分かります。無限次元であるSchauderを示すのに有限次元でのBrouwerをうまく使いたいわけですが、ここでSchauder射影作用素が効いています。無限次元空間でのすべての元に対して、その有限個の点列の凸包でもって不等式を成立させていますから、これによって有限個の点列から有限次元でのBrouwerの結果を使えるようにするわけです。なかなか考えましたね……

 

Banachの不動点定理では縮小写像という、写像に非常に強い制限を課していますが、Schauderは集合をcompactにすることで、写像はただの連続性だけでよいという非常にゆるい仮定において使えるというのがよいですね。

 

さて、これでやっと不動点定理が示せたので、さっそくこの不動点定理を用いて微分方程式を解いてみたいと思います。がんばるぞ~~

 

今回も見てくださってありがとうございます。