行列の応用

学習コース

1. ケーリー・ハミルトンの定理

(1) 特性方程式

定義4.1: 特性方程式
2 次正方行列 $$ A=\begin{pmatrix}a&b\\ c&d\end{pmatrix} $$ に対して、特性方程式とは次の多項式方程式のことをいう: $$ \det(\lambda I – A) = 0 $$ ここで $I$ は単位行列、$\lambda$ はスカラー変数である。

特性方程式に関する詳しい説明は以下の記事を参照して下さい。

(2) (2次の)ケーリー・ハミルトンの定理

定理4.2: 2次のケーリー・ハミルトンの定理
2次正方行列の特性方程式は以下。 $$ \det\begin{pmatrix}\lambda-a & -b\\ -c & \lambda-d\end{pmatrix} = \lambda^2 – (a+d)\lambda + (ad-bc) = 0 $$ ケーリー・ハミルトンの定理は、この特性多項式 $$ p(\lambda)=\lambda^2-(\operatorname{tr}A)\lambda+\det A $$ に $A$ 自身を代入すると零行列になる、つまり $$ \boxed{p(A)=A^2-(\operatorname{tr}A)A+(\det A)I=O} $$ が常に成り立つことを述べる。

証明をみる $A^2$ を計算すると $$ A^2 = \begin{pmatrix} a^2 + bc & ab + bd \\ ca + dc & cb + d^2 \end{pmatrix} $$ である。 次に $(\operatorname{tr}A)A = (a+d)A$ を計算すると $$ (a+d)A = \begin{pmatrix} a(a+d) & b(a+d) \\ c(a+d) & d(a+d) \end{pmatrix} $$ である。 最後に $(\det A)I = (ad-bc)I$ を加え、$A^2-(a+d)A+(ad-bc)I$ を各成分ごとに計算するとすべてが $0$ となり、定理が成立する

一般のケーリー・ハミルトンの定理(=$n$次元のケーリー・ハミルトンの定理)については以下の記事を参照して下さい。

2. 連立一次方程式

本章では二元連立一次方程式を扱います。一般の連立方程式の解については以下の記事を参照して下さい。

(1) 様々な行列(13):係数行列と拡大係数行列

定義4.3: 係数行列
2 元連立一次方程式 $$ \begin{cases} a_{11}x + a_{12}y = b_1 \\ a_{21}x + a_{22}y = b_2 \end{cases} $$ は $$ A\mathbf{x} = \mathbf{b}, \quad A=\begin{pmatrix} a_{11} & a_{12} \\ a_{21} & a_{22} \end{pmatrix}, \quad \mathbf{x} = \begin{pmatrix} x \\ y \end{pmatrix}, \quad \mathbf{b} = \begin{pmatrix} b_1 \\ b_2 \end{pmatrix} $$ と表すことができる。$A$は係数行列という。また$[A|\mathbf{b}]$を拡大係数行列という。

(2) 列空間の定義

定義4.4: 列空間
列空間$\operatorname{Col}(A)$は$A$の列ベクトルの線形結合で表されるベクトル全体の集合。

例えば$A=\begin{pmatrix} a_{11} & a_{12} \\ a_{21} & a_{22} \end{pmatrix}$ の列空間とは $$ \operatorname{Col}(A) = \{ \alpha \begin{pmatrix} a_{11} \\ a_{21} \end{pmatrix} + \beta \begin{pmatrix} a_{12} \\ a_{22} \end{pmatrix} \ |\ \alpha,\beta \in \mathbb{R} \} $$ のことである。

(3) 特解と同次解の定義

定義4.5: 特解と同次解
連立一次方程式$A\mathbf{x} = \mathbf{b}$の解の1つを特解という。解が複数ある場合は、そのうちのどれか1つを選んで特解とする

また、$\mathbf{b}$を$\mathbf{0}$に置き換えた$A\mathbf{x} = \mathbf{0}$を同次方程式といい、その解を同次解という。

(4) 2元連立一次方程式の解の公式

定理4.6: 2元連立一次方程式の解の公式
  1. $\det A \neq 0$の場合、解は唯一に定まり$\frac{1}{\det A}A^{-1}$で与えられる。
  2. $\det A = 0$だが$\mathbf{b} \in \operatorname{Col}(A)$の場合は解は無数に存在し(=不定)、解は特解$\mathbf{x}_0$と同次解$\mathbf{v}$を用いて$\mathbf{x}_0 + t\mathbf{v}$$(t \in \mathbb{R})$で与えられる。
  3. $\det A = 0$かつ$\mathbf{b} \notin \operatorname{Col}(A)$
  4. の場合、解は存在しない。

証明をみる (唯一解の場合) $\det A \neq 0$ のとき $A$ は可逆で、逆行列 $$ A^{-1} = \frac{1}{\det A} \begin{pmatrix} a_{22} & -a_{12} \\ -a_{21} & a_{11} \end{pmatrix} $$ が存在する。この場合、解は $$ \mathbf{x} = A^{-1} \mathbf{b} $$ で一意に定まる。
具体例をみる (唯一解の場合) 方程式系 $$ \begin{cases} 2x + y = 5 \\ x – y = 1 \end{cases} $$ に対し、 $$ A = \begin{pmatrix} 2 & 1 \\ 1 & -1 \end{pmatrix}, \quad \mathbf{b} = \begin{pmatrix} 5 \\ 1 \end{pmatrix} $$ となる。 $\det A = (2)(-1) – (1)(1) = -2 – 1 = -3 \neq 0$ より可逆であり、 $$ A^{-1} = \frac{1}{-3} \begin{pmatrix} -1 & -1 \\ -1 & 2 \end{pmatrix} $$ したがって $$ \mathbf{x} = \frac{1}{-3} \begin{pmatrix} -1 & -1 \\ -1 & 2 \end{pmatrix} \begin{pmatrix} 5 \\ 1 \end{pmatrix} = \frac{1}{-3} \begin{pmatrix} -6 \\ -3 \end{pmatrix} = \begin{pmatrix} 2 \\ 1 \end{pmatrix}. $$
証明をみる (不定の場合) $A=\begin{pmatrix}a_{11} & a_{12}\\a_{21} & a_{22}\end{pmatrix}$とすると、$\det A = 0$は$\frac{a_{11}}{a_{21}}=\frac{a_{12}}{a_{22}}$と同値であるから、$A$の2つの列ベクトルは線形従属。

一般に$A\mathbf{x}=\mathbf{b}$が解をもつためには、整合条件$\mathbf{b} \in \operatorname{Col}(A)$が成立する必要があるが、$A$の2つの列ベクトルは線形従属なので、整合条件は$\mathbf{b} \in (a_{11}, a_{21})^T$のようにどちらかの列ベクトルの定数倍で表されることと同値になる。

このとき、特解を$\mathbf{x}_0$、同次解を$\mathbf{v}$とおけば、$\mathbf{x}_0 + t\mathbf{v}$が解となる。実際、$A(\mathbf{x}_0 + \mathbf{v}) = \mathbf{b} + \mathbf{0}$となるので方程式を満たす。
具体例をみる (不定の場合) 方程式系 $$ \begin{cases} x + 2y = 4 \\ 2x + 4y = 8 \end{cases} $$ に対し、 $$ A = \begin{pmatrix} 1 & 2 \\ 2 & 4 \end{pmatrix}, \quad \mathbf{b} = \begin{pmatrix} 4 \\ 8 \end{pmatrix} $$ となる。 $\det A = 1\cdot 4 – 2\cdot 2 = 0$。列ベクトル $(1,2)^T$ と $(2,4)^T$ は一次従属。 $\mathbf{b} = 4(1,2)^T$ より $\mathbf{b} \in \operatorname{Col}(A)$。 特解は $y=1$ と置くと $x=2$ となり $\mathbf{x}_0 = (2,1)^T$。 同次方程式 $x + 2y = 0$ は $y=1$ と置けば $x=-2$、非零解 $\mathbf{v}=(-2,1)^T$。 したがって一般解は $$ \mathbf{x} = \begin{pmatrix} 2 \\ 1 \end{pmatrix} + t \begin{pmatrix} -2 \\ 1 \end{pmatrix},\quad t \in \mathbb{R}. $$
証明をみる (解なしの場合) 整合条件が満たされない場合、つまり$\mathbf{b} \notin \operatorname{Col}(A)$ の場合、解は存在しない。

$\det A =0$の場合は列ベクトルが1次従属なので、解が存在しないとは「$\mathbf{b}$が$(a_{11} a_{22})^T$のスカラー倍で表せないことと同値である。

これは言い換えれば、列空間が原点を通る 1 本の直線のとき、$\mathbf{b}$ がその直線上にないときは、対応する 2 本の直線(方程式の 2 式)が交わらず、解は存在しないと説明できる。
具体例をみる (解なしの場合) 方程式系 $$ \begin{cases} x + 2y = 4 \\ 2x + 4y = 7 \end{cases} $$ に対し、 $$ A = \begin{pmatrix} 1 & 2 \\ 2 & 4 \end{pmatrix}, \quad \mathbf{b} = \begin{pmatrix} 4 \\ 7 \end{pmatrix} $$ となる。 $\det A = 0$、列ベクトルは一次従属だが、$\mathbf{b}=(4,7)^T$ は $(1,2)^T$ の定数倍にならない。 したがって $\mathbf{b} \notin \operatorname{Col}(A)$ であり、解は存在しない。

3. 線形変換

線形変換に関するより詳しい説明は以下の記事を参照して下さい。

(1) 線形変換の定義

定義4.7: 線形変換
線形変換または1次変換 $T$ とは、任意のベクトル $\mathbf{x},\mathbf{y}$ とスカラー $\alpha,\beta$ に対して $$ T(\alpha \mathbf{x} + \beta \mathbf{y}) = \alpha T(\mathbf{x}) + \beta T(\mathbf{y}) $$ が成り立つ写像である。

(2) 様々な行列(14):表現行列の定義

定義4.8: 表現行列
線形変換は行列で表現することが可能であり、その行列を表現行列という。

(3) 表現行列の求め方

定理4.9: 表現行列の作成方法
2 次元ベクトル空間において、基底として単位ベクトル $$ \mathbf{e}_1 = (1,0)^T, \quad \mathbf{e}_2 = (0,1)^T $$ を取る。線形変換 $T$ の表現行列$[T]$は、$\mathbf{e}_1$ と $\mathbf{e}_2$ の像を $T(\mathbf{e}_1)$, $T(\mathbf{e}_2)$ として、以下で与えられる。 $$ [T] = \big( T(\mathbf{e}_1) \ \ T(\mathbf{e}_2) \big) $$

証明をみる 線形変換 $T$ による、$\mathbf{e}_1$ と $\mathbf{e}_2$ の像を $T(\mathbf{e}_1)$, $T(\mathbf{e}_2)$ として求めてまとめると、以下のようになる。 $$ T(\mathbf{e_1} \mathbf{e_2}) = (T(\mathbf{e}_1) T(\mathbf{e}_2)) $$ $(\mathbf{e_1} \mathbf{e_2})$は単位行列だから、 $$ T = (T(\mathbf{e}_1) T(\mathbf{e}_2)) $$ 従って、$T$の表現行列は$T(\mathbf{e}_1)$, $T(\mathbf{e}_2)$を列ベクトルとして並べたものである。従って、 $$ [T] = \big( T(\mathbf{e}_1) \ \ T(\mathbf{e}_2) \big) $$
具体例をみる 「x軸方向に2倍、y軸方向に3倍する変換」$T$ の場合 $\mathbf{e}_1=(1,0)^T$ は $(2,0)^T$ に移る。 $\mathbf{e}_2=(0,1)^T$ は $(0,3)^T$ に移る。 したがって $$ [T] = \begin{pmatrix} 2 & 0 \\ 0 & 3 \end{pmatrix} $$ となる。

(3) 様々な線形変換(1):様々な行列(15):回転変換

定理4.10: 回転行列
角 $\theta$ の回転変換を表す表現行列は $$ R(\theta)=\begin{pmatrix}\cos\theta&-\sin\theta\\ \sin\theta&\cos\theta\end{pmatrix} $$ で与えられる。
回転変換には以下の性質がある。 $$ R(\theta)R(\phi)=R(\theta+\phi),\ \ R(\theta)^T=R(-\theta),\ \ \det R(\theta)=1 $$

証明をみる 3(2)の「表現行列の作成方法」より直ちにに回転変換の表現行列が得られる。
回転変換の定義より、他の性質も容易に示すことが可能。

(4) 様々な線形変換(2):複素数の乗算

定理4.11: 複素数の乗算を表す線形変換
複素数 $z=a+bi$ による乗算 $w\mapsto zw$ は $\mathbb{R}^2$ 上の線形変換 $$ M_z=\begin{pmatrix}a&-b\\ b&a\end{pmatrix} $$ に対応する。
また、以下の性質がある。 $$ $M_{z_1}M_{z_2}=M_{z_1z_2}$,$\det M_z=a^2+b^2=|z|^2$(拡大率の二乗),$z=e^{i\theta}$ なら $M_z=R(\theta)$。 $$

4. 2次正方行列の n 乗

本節では主に2次正方行列の$n$乗を扱います。一般の正方行列の$n$乗については以下の記事を参照して下さい。

(1) 行列式が 0 の場合

対角行列の積について先に説明をします。

定理4.12: 行列のn乗(行列式が0の場合)
$\det A = 0$ならば$k=\operatorname{tr}A$として、 $$ A^{n}=k^{n-1}A $$

証明をみる ケーリー・ハミルトンの定理より $\det A=0$ なら $$ A^2-(\operatorname{tr}A)A=O\quad\Rightarrow\quad \boxed{\,A^2=kA\,}\ \ (k=\operatorname{tr}A). $$ 従って、$A^{n+1}=A\cdot A^{n}=A\cdot k^{n-1}A=k^{n-1}A^2=k^{n}A$となるから$A^{n}=k^{n-1}A$($n\ge2$)。 特に $k=0$ なら $A^2=O$(2 段階で 0 になるニルポテント)。

(2) 対角行列の場合

以下の記事の定理3.17より直ちに求めることができます。

次に対角行列の$n$乗を計算します。

定理4.13: 対角行列のn乗
$$ D=\operatorname{diag}(\lambda_1,\lambda_2)\ \Rightarrow\ D^n=\operatorname{diag}(\lambda_1^n,\lambda_2^n). $$

(3) 三角行列の場合

定理4.14: 上三角行列のn乗
上三角行列 $$ T=\begin{pmatrix}a&b\\0&d\end{pmatrix}\qquad(a,b,d\in\mathbb{R}\text{ あるいは }\mathbb{C}) $$ について、任意の整数 $n\ge 1$ に対し $$ T^n=\begin{pmatrix} a^n & b\,\displaystyle\sum_{k=0}^{n-1}a^{\,n-1-k}d^{\,k}\\[6pt] 0 & d^n \end{pmatrix} $$ が成り立つ。
とくに **閉じた形** として $a\ne d$ のとき $$ T^n=\begin{pmatrix} a^n & b\,\dfrac{a^n-d^n}{a-d}\\[6pt] 0 & d^n \end{pmatrix} $$ $a=d$ のとき $$ T^n=\begin{pmatrix} a^n & n\,a^{\,n-1}\,b\\[6pt] 0 & a^n \end{pmatrix} $$

証明をみる (漸化式を利用) 以下の記事の定理3.18より、
$n\ge 1$ に対して $$ T^n=\begin{pmatrix}a^n&x_n\\0&d^n\end{pmatrix} $$ とおける($x_n$ が上右成分)。$T^{n+1}=T^nT$ を計算すると $$ T^{n+1}=\begin{pmatrix}a^n&x_n\\0&d^n\end{pmatrix} \begin{pmatrix}a&b\\0&d\end{pmatrix} =\begin{pmatrix} a^{n+1} & a^n b + x_n d\\[2pt] 0 & d^{n+1} \end{pmatrix} $$ したがって上右成分は**一次線形漸化式** $$ x_{n+1}=a^n b + d\,x_n,\qquad x_1=b $$ を満たす。

この漸化式を解く。$x_n$ を $$ x_n=b\sum_{k=0}^{n-1}a^{\,n-1-k}d^{\,k} $$ と仮定して右辺に代入すると $$ \begin{aligned} x_{n+1} &=a^n b + d\,b\sum_{k=0}^{n-1}a^{\,n-1-k}d^{\,k}\\ &=b\Big(a^n+\sum_{k=0}^{n-1}a^{\,n-1-k}d^{\,k+1}\Big) =b\sum_{k=0}^{n}a^{\,n-k}d^{\,k} \end{aligned} $$ となり、$n\!\to\!n+1$ の形が得られる。初期値 $x_1=b\sum_{k=0}^{0}a^{0-k}d^k=b$ も満たすので完全帰納法により $$ x_n=b\sum_{k=0}^{n-1}a^{\,n-1-k}d^{\,k} $$ が証明された。ゆえに $$ T^n=\begin{pmatrix} a^n & b\sum_{k=0}^{n-1}a^{\,n-1-k}d^{\,k}\\[4pt] 0 & d^n \end{pmatrix} $$ が成立する。

和 $\displaystyle S_{n-1}(a,d)=\sum_{k=0}^{n-1}a^{\,n-1-k}d^{\,k}$ は
– $a\ne d$ のとき $$ S_{n-1}(a,d)=a^{\,n-1}\sum_{k=0}^{n-1}\Big(\frac{d}{a}\Big)^k =a^{\,n-1}\cdot\frac{1-(d/a)^{n}}{1-d/a} =\frac{a^{n}-d^{n}}{a-d} $$ – $a=d$ のとき $$ S_{n-1}(a,a)=\sum_{k=0}^{n-1}a^{\,n-1}=n\,a^{\,n-1} $$ よって 題意成立。
証明をみる (ジョルダン標準形の観点) $a=d=\lambda$ のとき $$ T=\begin{pmatrix}\lambda&b\\0&\lambda\end{pmatrix} =\lambda I+\begin{pmatrix}0&b\\0&0\end{pmatrix} =\lambda I + N,\quad N^2=0 $$ $N$ が冪零($N^2=0$)なので二項定理から $$ T^n=(\lambda I+N)^n=\sum_{r=0}^{n}\binom{n}{r}\lambda^{\,n-r}N^{r} =\lambda^{\,n}I+n\lambda^{\,n-1}N =\begin{pmatrix}\lambda^n&n\lambda^{\,n-1}b\\0&\lambda^n\end{pmatrix} $$ が直ちに得られ、先の結果と一致する。
具体例をみる $a=2,\ b=3,\ d=5,\ n=3$ とする。 公式より $$ T^3=\begin{pmatrix} 2^3 & 3\cdot\frac{2^3-5^3}{2-5}\\ 0 & 5^3 \end{pmatrix} =\begin{pmatrix} 8 & 3\cdot\frac{8-125}{-3}\\ 0 & 125 \end{pmatrix} =\begin{pmatrix} 8 & 117\\ 0 & 125 \end{pmatrix} $$ 直接計算(省略)でも同じ結果になる。

(4) 回転行列の場合

定理4.15: 回転行列のn乗
$$ R(\theta)^n=R(n\theta). $$

証明をみる $R(\theta)R(\phi)=R(\theta+\phi)$ を帰納適用。あるいは複素表示 $e^{i\theta}$ の $n$ 乗から従う。$\square$

(5) 対角化可能な場合

対角化の詳細については以下の記事を参照して下さい。

定理4.16: 対角化可能な行列のn乗
$A$が$A$の固有ベクトルを並べた$P$によって対角行列$D$に変換可能である場合、すなわち$A=PDP^{-1}$と表現できる場合、 $$ A^n=PD^{n}P^{-1} $$

証明をみる $A^n=(PDP^{-1})^n=(PDP^{-1})\cdots(PDP^{-1})=PD^{n}P^{-1}$ と明らか。
具体例をみる 次の上三角行列を考えます(固有値が 3 と 2 で異なるため,必ず対角化可能): $$ A=\begin{pmatrix}3&1\\0&2\end{pmatrix}. $$
1. 固有値と固有ベクトル
特性多項式は $$ \det(A-\lambda I)=\det\begin{pmatrix}3-\lambda&1\\0&2-\lambda\end{pmatrix}=(3-\lambda)(2-\lambda). $$ したがって固有値は $$ \lambda_1=3,\qquad \lambda_2=2. $$
各固有値に対する固有ベクトルを求めます。
– $\lambda=3$ のとき: $$ (A-3I)\mathbf{v}=\begin{pmatrix}0&1\\0&-1\end{pmatrix}\mathbf{v}=\mathbf{0}\ \Rightarrow\ y=0. $$ よって $\mathbf{v}_1=\begin{pmatrix}1\\0\end{pmatrix}$ を取る。

– $\lambda=2$ のとき: $$ (A-2I)\mathbf{v}=\begin{pmatrix}1&1\\0&0\end{pmatrix}\mathbf{v}=\mathbf{0}\ \Rightarrow\ x+y=0. $$ よって $\mathbf{v}_2=\begin{pmatrix}-1\\1\end{pmatrix}$ を取る(あるいは比例ベクトルでも可)。
2. 対角化(固有値分解)
固有ベクトルを列に並べて $$ P=\bigl[\mathbf{v}_1\ \mathbf{v}_2\bigr]=\begin{pmatrix}1&-1\\0&1\end{pmatrix},\qquad D=\begin{pmatrix}3&0\\0&2\end{pmatrix}. $$ このとき $$ A=PDP^{-1}. $$ $P$ は三角行列なので逆行列は容易に $$ P^{-1}=\begin{pmatrix}1&1\\0&1\end{pmatrix}. $$ 実際に確認すると $$ PDP^{-1} =\begin{pmatrix}1&-1\\0&1\end{pmatrix}\begin{pmatrix}3&0\\0&2\end{pmatrix}\begin{pmatrix}1&1\\0&1\end{pmatrix} =\begin{pmatrix}3&1\\0&2\end{pmatrix}=A. $$
3. $A^n$ の計算
固有値分解の基本公式 $A^n=PD^nP^{-1}$ を用いる: $$ D^n=\begin{pmatrix}3^n&0\\0&2^n\end{pmatrix}. $$ まず $PD^n$ を計算: $$ PD^n=\begin{pmatrix}1&-1\\0&1\end{pmatrix}\begin{pmatrix}3^n&0\\0&2^n\end{pmatrix} =\begin{pmatrix}3^n&-2^n\\0&2^n\end{pmatrix}. $$ つづいて $A^n=(PD^n)P^{-1}$: $$ A^n=\begin{pmatrix}3^n&-2^n\\0&2^n\end{pmatrix}\begin{pmatrix}1&1\\0&1\end{pmatrix} =\begin{pmatrix} 3^n&3^n-2^n\\ 0&2^n \end{pmatrix}. $$
4. 検算($n=1,2$) – $n=1$:$A^1=\begin{pmatrix}3&1\\0&2\end{pmatrix}$(一致)。
– $n=2$:公式より $$ A^2=\begin{pmatrix}3^2&3^2-2^2\\0&2^2\end{pmatrix} =\begin{pmatrix}9&5\\0&4\end{pmatrix}, $$ 一方で直接計算しても $$ \begin{pmatrix}3&1\\0&2\end{pmatrix}^2 =\begin{pmatrix}9&5\\0&4\end{pmatrix} $$ と一致。


結論(一般式)
$$ \boxed{\,A^n=\begin{pmatrix}3^n&3^n-2^n\\[2pt]0&2^n\end{pmatrix}\,} $$
固有値分解 $A=PDP^{-1}$ を用いると,$D^n$ は固有値を $n$ 乗するだけでよく,その後 $P$ と $P^{-1}$ で挟むだけで $A^n$ が得られる。

(6) 三角化可能(ジョルダン標準形)な場合

ジョルダン標準形の詳細については以下の記事を参照して下さい。

定理4.17: ジョルダン標準形に変形可能な行列のn乗
以下のように$A$を$A$の固有値に基づいた$J$によりジョルダン標準形に変形できる場合、 $$ A=PJP^{-1},\quad J=\begin{pmatrix}\lambda&1\\0&\lambda\end{pmatrix} =\lambda I+N,\ N=\begin{pmatrix}0&1\\0&0\end{pmatrix},\ N^2=O. $$ $A^n$は以下。 $$ \boxed{\,A^n=P(\lambda^n I+n\lambda^{n-1}N)P^{-1}\,}. $$

証明をみる $$ A=PJP^{-1},\quad J=\begin{pmatrix}\lambda&1\\0&\lambda\end{pmatrix} =\lambda I+N,\ N=\begin{pmatrix}0&1\\0&0\end{pmatrix},\ N^2=O. $$ 二項定理により $$ J^n=(\lambda I+N)^n=\sum_{k=0}^n\binom{n}{k}\lambda^{n-k}N^k =\lambda^n I+n\lambda^{n-1}N. $$ したがって $$ \boxed{\,A^n=P(\lambda^n I+n\lambda^{n-1}N)P^{-1}\,}. $$
具体例をみる ここでは,対角化できない具体例として $$ A=\begin{pmatrix}3&-1\\[2pt]1&1\end{pmatrix} $$ を扱い,ジョルダン標準形に相似変換してから $A^n$ を求めます。

1. 固有値と「対角化できない」ことの確認
特性多項式は $$ \chi_A(\lambda)=\det(A-\lambda I) =\det\begin{pmatrix}3-\lambda&-1\\[2pt]1&1-\lambda\end{pmatrix} =(3-\lambda)(1-\lambda)+1 =\lambda^2-4\lambda+4=(\lambda-2)^2. $$ 固有値は重複度 2 の $\lambda=2$ ただ一つです。

固有ベクトルは $(A-2I)\mathbf{x}=\mathbf{0}$ を解いて得ます: $$ A-2I=\begin{pmatrix}1&-1\\[2pt]1&-1\end{pmatrix},\qquad \begin{pmatrix}1&-1\\[2pt]1&-1\end{pmatrix}\begin{pmatrix}x\\y\end{pmatrix}=\begin{pmatrix}0\\0\end{pmatrix} \ \Rightarrow\ x-y=0. $$ したがって固有空間は $\mathrm{span}\{(1,1)^{\mathsf T}\}$ の 1 次元。**重複度 2 に対して固有ベクトルが 1 本しかない**ので,$A$ は対角化できません。


2. ジョルダン鎖(一般化固有ベクトル)の構成
固有ベクトルを $$ \mathbf{v}_1=\begin{pmatrix}1\\[2pt]1\end{pmatrix} $$ とします。次に一般化固有ベクトル $\mathbf{v}_2$ を $$ (A-2I)\mathbf{v}_2=\mathbf{v}_1 $$ を満たすように求めます。計算すると $$ \begin{pmatrix}1&-1\\[2pt]1&-1\end{pmatrix}\begin{pmatrix}x\\y\end{pmatrix} =\begin{pmatrix}1\\[2pt]1\end{pmatrix} \ \Rightarrow\ x-y=1. $$ ひとつの解として $\mathbf{v}_2=(1,0)^{\mathsf T}$ が取れます($1-0=1$)。

このとき $$ P=\bigl[\mathbf{v}_1\ \mathbf{v}_2\bigr] =\begin{pmatrix}1&1\\[2pt]1&0\end{pmatrix}, \qquad J=\begin{pmatrix}2&1\\[2pt]0&2\end{pmatrix} \quad(\text{2 次のジョルダンブロック}) $$ として $$ A=PJP^{-1} $$ が成り立ちます(下で確認します)。
$P$ の逆行列は $$ \det P=1\cdot0-1\cdot1=-1,\quad P^{-1}=\frac{1}{-1}\begin{pmatrix}0&-1\\[2pt]-1&1\end{pmatrix} =\begin{pmatrix}0&1\\[2pt]1&-1\end{pmatrix}. $$
**確認($A=PJP^{-1}$):**
まず $$ JP^{-1} =\begin{pmatrix}2&1\\[2pt]0&2\end{pmatrix}\begin{pmatrix}0&1\\[2pt]1&-1\end{pmatrix} =\begin{pmatrix}1&1\\[2pt]2&-2\end{pmatrix}, $$ ついで $$ P(JP^{-1}) =\begin{pmatrix}1&1\\[2pt]1&0\end{pmatrix}\begin{pmatrix}1&1\\[2pt]2&-2\end{pmatrix} =\begin{pmatrix}3&-1\\[2pt]1&1\end{pmatrix}=A. $$

3. ジョルダン標準形の $n$ 乗
$J$ は $\lambda=2$ のジョルダンブロックなので,$J=2I+N$ とおくと $$ N=\begin{pmatrix}0&1\\[2pt]0&0\end{pmatrix},\quad N^2=0. $$ 二項定理(ただし $N^2=0$ なので 2 次で止まる)から $$ J^n=(2I+N)^n=\sum_{r=0}^{n}\binom{n}{r}2^{\,n-r}N^r =2^n I+n\,2^{\,n-1}N =\begin{pmatrix}2^n&n\,2^{\,n-1}\\[2pt]0&2^n\end{pmatrix}. $$

4. $A^n=PJ^nP^{-1}$ の計算
まず $$ J^nP^{-1} =\begin{pmatrix}2^n&n\,2^{\,n-1}\\[2pt]0&2^n\end{pmatrix} \begin{pmatrix}0&1\\[2pt]1&-1\end{pmatrix} =\begin{pmatrix}n\,2^{\,n-1}&2^{\,n-1}(2-n)\\[2pt]2^n&-2^n\end{pmatrix}. $$ ついで $$ A^n=P(J^nP^{-1}) =\begin{pmatrix}1&1\\[2pt]1&0\end{pmatrix} \begin{pmatrix}n\,2^{\,n-1}&2^{\,n-1}(2-n)\\[2pt]2^n&-2^n\end{pmatrix} =\begin{pmatrix} 2^{\,n-1}(n+2)&-\,n\,2^{\,n-1}\\[4pt] n\,2^{\,n-1}&2^{\,n-1}(2-n) \end{pmatrix}. $$
**最終結果(簡潔形):**
$$ \boxed{\ A^n=2^{\,n-1}\begin{pmatrix}n+2&-n\\[2pt]n&2-n\end{pmatrix}\qquad(n\in\mathbb{N})\ } $$

5. 検算
– $n=1$:$2^{0}\begin{pmatrix}3&-1\\[2pt]1&1\end{pmatrix}=A$(一致)。
– $n=2$:$2^{1}\begin{pmatrix}4&-2\\[2pt]2&0\end{pmatrix} =\begin{pmatrix}8&-4\\[2pt]4&0\end{pmatrix}$。
直接計算でも $$ A^2=\begin{pmatrix}3&-1\\[2pt]1&1\end{pmatrix}^2 =\begin{pmatrix}8&-4\\[2pt]4&0\end{pmatrix} $$ で一致。

まとめ
対角化できない行列でも,ジョルダン標準形 $J$ を用いれば $$ A=PJP^{-1}\ \Rightarrow\ A^n=PJ^nP^{-1} $$ として明示的に $A^n$ を求められます。2×2 の場合,$J$ は 1 ブロックなので $$ J^n=\lambda^n I+n\,\lambda^{n-1}N\quad(N^2=0) $$ という簡潔な形で計算できます。

5. 行列と漸化式

(1) 漸化式と行列に関する定理(1):2 項間漸化式の行列による表現

定理4.18: 2項間漸化式と行列
2 項間漸化式 $$ u_{n+1}=a\,u_n+b\,u_{n-1} $$ を $$ \mathbf{v}_{n}=\begin{pmatrix}u_n\\u_{n-1}\end{pmatrix},\quad \mathbf{v}_{n+1}=C\,\mathbf{v}_n,\ C=\begin{pmatrix}a&b\\1&0\end{pmatrix} $$ と書くと $\mathbf{v}_{n}=C^{\,n}\mathbf{v}_0$($\mathbf{v}_0=(u_0,u_{-1})^T$)。初期条件が $u_0,u_1$ の場合は $\mathbf{v}_1=(u_1,u_0)^T$ から $\mathbf{v}_{n} = C^{\,n-1}\mathbf{v}_1$。

(2) 漸化式と行列に関する定理(2):2 項間漸化式の一般項

定理4.19: 2項間漸化式の一般項
$C$ の特性多項式は $$ \chi_C(\lambda)=\lambda^2-a\lambda-b. $$ 根を $\lambda_{1,2}$ とする。場合分け:

(重根でない)$\lambda_1\ne\lambda_2$:$C=P\operatorname{diag}(\lambda_1,\lambda_2)P^{-1}$ なので $$ C^n=P\operatorname{diag}(\lambda_1^n,\lambda_2^n)P^{-1}. $$ よって $$ \boxed{\,u_n=\alpha\,\lambda_1^{\,n}+\beta\,\lambda_2^{\,n}\,}, $$ 係数 $\alpha,\beta$ は初期条件 $u_0,u_1$ から $$ \begin{pmatrix}1&1\\ \lambda_1&\lambda_2\end{pmatrix}\begin{pmatrix}\alpha\\ \beta\end{pmatrix} =\begin{pmatrix}u_0\\ u_1\end{pmatrix}\ \Rightarrow\ \alpha=\frac{u_1-u_0\lambda_2}{\lambda_1-\lambda_2},\quad \beta=\frac{u_0\lambda_1-u_1}{\lambda_1-\lambda_2}. $$
(重根)$\lambda_1=\lambda_2=\lambda$:$C$ はジョルダン形 $J=\lambda I+N,\ N^2=O$ に相似で $$ C^n\sim J^n=\lambda^n I+n\lambda^{n-1}N. $$ したがって $$ \boxed{\,u_n=(\alpha+\beta n)\lambda^{\,n}\,}, $$ 係数は $u_0=\alpha,\ u_1=(\alpha+\beta)\lambda$ より $\alpha=u_0,\ \beta=\frac{u_1}{\lambda}-u_0$。

(3) 2 項間漸化式の簡単な解法

特性方程式 $\lambda^2-a\lambda-b=0$ を解き,解の型
$$
u_n=\begin{cases}
\alpha\,\lambda_1^n+\beta\,\lambda_2^n,& \lambda_1\ne\lambda_2,\\[2pt]
(\alpha+\beta n)\lambda^n,& \lambda_1=\lambda_2=\lambda
\end{cases}
$$
を仮定し,初期条件 $u_0,u_1$ から $\alpha,\beta$ を決定する。これは(2)での行列法の結果と一致する。

コメント