行列の応用

バイオインフォ基礎

1. ケーリー・ハミルトンの定理

(1) 特性方程式と固有値

特性方程式と固有値
2 次正方行列 $$ A=\begin{pmatrix}a&b\\ c&d\end{pmatrix} $$ に対して、特性方程式とは次の多項式方程式のことをいう: $$ \det(\lambda I – A) = 0 $$ ここで $I$ は単位行列、$\lambda$ はスカラー変数である。
また、特性方程式の解を固有値という。

特性方程式と固有値に関する詳しい説明は以下の記事を参照して下さい。

(2) (2次の)ケーリー・ハミルトンの定理

2次のケーリー・ハミルトンの定理
2次正方行列の特性方程式は以下。 $$ \det\begin{pmatrix}\lambda-a & -b\\ -c & \lambda-d\end{pmatrix} = \lambda^2 – (a+d)\lambda + (ad-bc) = 0 $$ ケーリー・ハミルトンの定理は、この特性多項式 $$ p(\lambda)=\lambda^2-(\operatorname{tr}A)\lambda+\det A $$ に $A$ 自身を代入すると零行列になる、つまり $$ \boxed{p(A)=A^2-(\operatorname{tr}A)A+(\det A)I=O} $$ が常に成り立つことを述べる。

証明をみる $A^2$ を計算すると $$ A^2 = \begin{pmatrix} a^2 + bc & ab + bd \\ ca + dc & cb + d^2 \end{pmatrix} $$ である。 次に $(\operatorname{tr}A)A = (a+d)A$ を計算すると $$ (a+d)A = \begin{pmatrix} a(a+d) & b(a+d) \\ c(a+d) & d(a+d) \end{pmatrix} $$ である。 最後に $(\det A)I = (ad-bc)I$ を加え、$A^2-(a+d)A+(ad-bc)I$ を各成分ごとに計算するとすべてが $0$ となり、定理が成立する

一般のケーリー・ハミルトンの定理(=$n$次元のケーリー・ハミルトンの定理)については以下の記事を参照して下さい。

2. 連立一次方程式

本章では二元連立一次方程式を扱います。一般の連立方程式の解については以下の記事を参照して下さい。

(1) 2元連立一次方程式の行列による表現

2 元連立一次方程式
$$
\begin{cases}
a_{11}x + a_{12}y = b_1 \\
a_{21}x + a_{22}y = b_2
\end{cases}
$$

$$
A\mathbf{x} = \mathbf{b}, \quad
A=\begin{pmatrix} a_{11} & a_{12} \\ a_{21} & a_{22} \end{pmatrix}, \quad
\mathbf{x} = \begin{pmatrix} x \\ y \end{pmatrix}, \quad
\mathbf{b} = \begin{pmatrix} b_1 \\ b_2 \end{pmatrix}
$$
と表すことができる。$A$は係数行列という。

(2) 係数行列の行列式が 0 でない場合の解

$\det A \neq 0$ のとき $A$ は可逆で、逆行列
$$
A^{-1} = \frac{1}{\det A}
\begin{pmatrix}
a_{22} & -a_{12} \\
-a_{21} & a_{11}
\end{pmatrix}
$$
が存在する。この場合、解は
$$
\mathbf{x} = A^{-1} \mathbf{b}
$$
で一意に定まる。

具体例をみる 方程式系 $$ \begin{cases} 2x + y = 5 \\ x – y = 1 \end{cases} $$ に対し、 $$ A = \begin{pmatrix} 2 & 1 \\ 1 & -1 \end{pmatrix}, \quad \mathbf{b} = \begin{pmatrix} 5 \\ 1 \end{pmatrix} $$ となる。 $\det A = (2)(-1) – (1)(1) = -2 – 1 = -3 \neq 0$ より可逆であり、 $$ A^{-1} = \frac{1}{-3} \begin{pmatrix} -1 & -1 \\ -1 & 2 \end{pmatrix} $$ したがって $$ \mathbf{x} = \frac{1}{-3} \begin{pmatrix} -1 & -1 \\ -1 & 2 \end{pmatrix} \begin{pmatrix} 5 \\ 1 \end{pmatrix} = \frac{1}{-3} \begin{pmatrix} -6 \\ -3 \end{pmatrix} = \begin{pmatrix} 2 \\ 1 \end{pmatrix}. $$

(3) 係数行列の行列式が 0 だが解が存在する場合(不定)

$\det A =0$であるかによらず、連立一次方程式の解の存在条件は、以下の整合条件と同値である。
$$
\mathbf{b} \in \operatorname{Col}(A)
$$

ここで、$\operatorname{Col}(A)$は列空間といい、$A=\begin{pmatrix} a_{11} & a_{12} \\ a_{21} & a_{22} \end{pmatrix}$ の列空間とは
$$
\operatorname{Col}(A) = \{
\alpha \begin{pmatrix} a_{11} \\ a_{21} \end{pmatrix} +
\beta \begin{pmatrix} a_{12} \\ a_{22} \end{pmatrix}
\ |\ \alpha,\beta \in \mathbb{R} \}
$$
のことである。従って、整合条件は単純に$\mathbf{b}=(b_1,b_2)^T$が$A$の列ベクトルの線形結合で表されることを意味する。

今、$\det A = 0$であるので、$a_{11} a_{22} – a_{21} a_{12}=0$。これを変形すれば、以下となる。

$$
\frac{a_{11}}{a_{21}} = \frac{a_{12}}{a_{22}}
$$

これは$A$を構成する2つの列ベクトルが線形従属であることを意味するので、整合条件は結局$\mathbf{b} \in \operatorname{Col}(a_{11} a_{21})^T$となり、$\det A =0$で解が存在するとは$\mathbf{b}$が$k(a_{11} a_{22})^T$で表されることに他ならないことが分かる。

なお、この場合のように2×2 行列で列ベクトルが一次従属の場合、列空間は原点を通る 1 本の直線になるとも表現できる。従って、整合条件は $\mathbf{b}$ がその直線上にあるとも表現できる。

上記の整合条件が満たされる場合の一般解は、

  • 特解 $\mathbf{x}_0$:$A\mathbf{x}=\mathbf{b}$ を満たす 1 つの解。列ベクトルが1次従属なので、2つの方程式のうちどちかについて例えば $y$ に任意の値を設定して $x$ を解けば、それは他方の方程式の解になるため、特解が得られる。
  • 同次方程式の非零解 $\mathbf{v}$:同次方程式とは連立方程式の定数項を0とした方程式$A\mathbf{x}=\mathbf{0}$であり、この解が$\mathbf{v}$。同次方程式も列が1次従属なので、2つの方程式のうちどちかについて例えば $y$ に任意の値を設定して $x$ を解けば、それは他方の方程式の解になるため、解が得られる。

を用いて
$$
\mathbf{x} = \mathbf{x}_0 + t\,\mathbf{v} \quad (t \in \mathbb{R})
$$
で与えられる。これは、

$$
\begin{align}
A\mathbf{x} &= A\mathbf{x}_0 + t\,\mathbf{v} \quad (t \in \mathbb{R}) \\
&= \mathbf{b} + \mathbf{0} \\
&= \mathbf{b}
\end{align}
$$

から明らかである。

なお、このように無数の解をもつ状況を不定という。

具体例をみる 方程式系 $$ \begin{cases} x + 2y = 4 \\ 2x + 4y = 8 \end{cases} $$ に対し、 $$ A = \begin{pmatrix} 1 & 2 \\ 2 & 4 \end{pmatrix}, \quad \mathbf{b} = \begin{pmatrix} 4 \\ 8 \end{pmatrix} $$ となる。 $\det A = 1\cdot 4 – 2\cdot 2 = 0$。列ベクトル $(1,2)^T$ と $(2,4)^T$ は一次従属。 $\mathbf{b} = 4(1,2)^T$ より $\mathbf{b} \in \operatorname{Col}(A)$。 特解は $y=1$ と置くと $x=2$ となり $\mathbf{x}_0 = (2,1)^T$。 同次方程式 $x + 2y = 0$ は $y=1$ と置けば $x=-2$、非零解 $\mathbf{v}=(-2,1)^T$。 したがって一般解は $$ \mathbf{x} = \begin{pmatrix} 2 \\ 1 \end{pmatrix} + t \begin{pmatrix} -2 \\ 1 \end{pmatrix},\quad t \in \mathbb{R}. $$

(4) 係数行列の行列式が 0 で解が存在しない場合

整合条件が満たされない場合、つまり$\mathbf{b} \notin \operatorname{Col}(A)$ の場合、解は存在しない。

$\det A =0$の場合は列ベクトルが1次従属なので、解が存在しないとは「$\mathbf{b}$が$(a_{11} a_{22})^T$のスカラー倍で表せないことと同値である。

これは言い換えれば、列空間が原点を通る 1 本の直線のとき、$\mathbf{b}$ がその直線上にないときは、対応する 2 本の直線(方程式の 2 式)が交わらず、解は存在しないと説明できる。

具体例をみる 方程式系 $$ \begin{cases} x + 2y = 4 \\ 2x + 4y = 7 \end{cases} $$ に対し、 $$ A = \begin{pmatrix} 1 & 2 \\ 2 & 4 \end{pmatrix}, \quad \mathbf{b} = \begin{pmatrix} 4 \\ 7 \end{pmatrix} $$ となる。 $\det A = 0$、列ベクトルは一次従属だが、$\mathbf{b}=(4,7)^T$ は $(1,2)^T$ の定数倍にならない。 したがって $\mathbf{b} \notin \operatorname{Col}(A)$ であり、解は存在しない。

3. 線形写像

線形写像に関するより詳しい説明は以下の記事を参照して下さい。

(1) 1次変換の定義

線形変換
線形変換または1次変換 $T$ とは、任意のベクトル $\mathbf{x},\mathbf{y}$ とスカラー $\alpha,\beta$ に対して $$ T(\alpha \mathbf{x} + \beta \mathbf{y}) = \alpha T(\mathbf{x}) + \beta T(\mathbf{y}) $$ が成り立つ写像である。
線形変換Tは行列で表現することが可能であり、その行列を表現行列という。

(2) 表現行列の求め方

表現行列の作成方法
2 次元ベクトル空間において、基底として単位ベクトル $$ \mathbf{e}_1 = (1,0)^T, \quad \mathbf{e}_2 = (0,1)^T $$ を取る。線形変換 $T$ の表現行列$[T]$は、$\mathbf{e}_1$ と $\mathbf{e}_2$ の像を $T(\mathbf{e}_1)$, $T(\mathbf{e}_2)$ として、以下で与えられる。 $$ [T] = \big( T(\mathbf{e}_1) \ \ T(\mathbf{e}_2) \big) $$

証明をみる 線形変換 $T$ による、$\mathbf{e}_1$ と $\mathbf{e}_2$ の像を $T(\mathbf{e}_1)$, $T(\mathbf{e}_2)$ として求めてまとめると、以下のようになる。 $$ T(\mathbf{e_1} \mathbf{e_2}) = (T(\mathbf{e}_1) T(\mathbf{e}_2)) $$ $(\mathbf{e_1} \mathbf{e_2})$は単位行列だから、 $$ T = (T(\mathbf{e}_1) T(\mathbf{e}_2)) $$ 従って、$T$の表現行列は$T(\mathbf{e}_1)$, $T(\mathbf{e}_2)$を列ベクトルとして並べたものである。従って、 $$ [T] = \big( T(\mathbf{e}_1) \ \ T(\mathbf{e}_2) \big) $$
具体例をみる 「x軸方向に2倍、y軸方向に3倍する変換」$T$ の場合 $\mathbf{e}_1=(1,0)^T$ は $(2,0)^T$ に移る。 $\mathbf{e}_2=(0,1)^T$ は $(0,3)^T$ に移る。 したがって $$ [T] = \begin{pmatrix} 2 & 0 \\ 0 & 3 \end{pmatrix} $$ となる。

4. 様々な1次変換

(1) 2次元の回転変換

回転行列
角 $\theta$ の回転変換を表す表現行列は $$ R(\theta)=\begin{pmatrix}\cos\theta&-\sin\theta\\ \sin\theta&\cos\theta\end{pmatrix} $$ で与えられる。
回転変換には以下の性質がある。 $$ R(\theta)R(\phi)=R(\theta+\phi),\ \ R(\theta)^T=R(-\theta),\ \ \det R(\theta)=1 $$

証明をみる 3(2)の「表現行列の作成方法」より直ちにに回転変換の表現行列が得られる。
回転変換の定義より、他の性質も容易に示すことが可能。

(2) 複素数の乗算に相当する変換

複素数の乗算を表す線形変換
複素数 $z=a+bi$ による乗算 $w\mapsto zw$ は $\mathbb{R}^2$ 上の線形変換 $$ M_z=\begin{pmatrix}a&-b\\ b&a\end{pmatrix} $$ に対応する。
また、以下の性質がある。 $$ $M_{z_1}M_{z_2}=M_{z_1z_2}$,$\det M_z=a^2+b^2=|z|^2$(拡大率の二乗),$z=e^{i\theta}$ なら $M_z=R(\theta)$。 $$

5. 2次正方行列の n 乗

本節では主に2次正方行列の$n$乗を扱います。一般の正方行列の$n$乗については以下の記事を参照して下さい。

(1) 行列式が 0 の場合

対角行列の積について先に説明をします。

行列のn乗(行列式が0の場合)
$\det A = 0$ならば$k=\operatorname{tr}A$として、 $$ A^{n}=k^{n-1}A $$

証明をみる ケーリー・ハミルトンの定理より $\det A=0$ なら $$ A^2-(\operatorname{tr}A)A=O\quad\Rightarrow\quad \boxed{\,A^2=kA\,}\ \ (k=\operatorname{tr}A). $$ 従って、$A^{n+1}=A\cdot A^{n}=A\cdot k^{n-1}A=k^{n-1}A^2=k^{n}A$となるから$A^{n}=k^{n-1}A$($n\ge2$)。 特に $k=0$ なら $A^2=O$(2 段階で 0 になるニルポテント)。

(2) 対角行列の場合

まず対角行列の積の性質について示します。

対角行列の積
$$ \operatorname{diag}(a_1,\dots,a_n)\cdot \operatorname{diag}(b_1,\dots,b_n) =\operatorname{diag}(a_1b_1,\dots,a_nb_n). $$

証明をみる 積の $(i,j)$ 成分は $\sum_k a_i\delta_{ik}\,b_k\delta_{kj}=a_i b_i\delta_{ij}$。$\square$

次に対角行列の$n$乗を計算します。

対角行列のn乗
$$ D=\operatorname{diag}(\lambda_1,\lambda_2)\ \Rightarrow\ D^n=\operatorname{diag}(\lambda_1^n,\lambda_2^n). $$

(3) 三角行列の場合

上三角行列のn乗
上三角行列 $$ T=\begin{pmatrix}a&b\\0&d\end{pmatrix}\qquad(a,b,d\in\mathbb{R}\text{ あるいは }\mathbb{C}) $$ について、任意の整数 $n\ge 1$ に対し $$ T^n=\begin{pmatrix} a^n & b\,\displaystyle\sum_{k=0}^{n-1}a^{\,n-1-k}d^{\,k}\\[6pt] 0 & d^n \end{pmatrix} $$ が成り立つ。
とくに **閉じた形** として $a\ne d$ のとき $$ T^n=\begin{pmatrix} a^n & b\,\dfrac{a^n-d^n}{a-d}\\[6pt] 0 & d^n \end{pmatrix} $$ $a=d$ のとき $$ T^n=\begin{pmatrix} a^n & n\,a^{\,n-1}\,b\\[6pt] 0 & a^n \end{pmatrix} $$

証明をみる (漸化式を利用) $n\ge 1$ に対して $$ T^n=\begin{pmatrix}a^n&x_n\\0&d^n\end{pmatrix} $$ とおく($x_n$ が上右成分)。$T^{n+1}=T^nT$ を計算すると $$ T^{n+1}=\begin{pmatrix}a^n&x_n\\0&d^n\end{pmatrix} \begin{pmatrix}a&b\\0&d\end{pmatrix} =\begin{pmatrix} a^{n+1} & a^n b + x_n d\\[2pt] 0 & d^{n+1} \end{pmatrix} $$ したがって上右成分は**一次線形漸化式** $$ x_{n+1}=a^n b + d\,x_n,\qquad x_1=b $$ を満たす。

この漸化式を解く。$x_n$ を $$ x_n=b\sum_{k=0}^{n-1}a^{\,n-1-k}d^{\,k} $$ と仮定して右辺に代入すると $$ \begin{aligned} x_{n+1} &=a^n b + d\,b\sum_{k=0}^{n-1}a^{\,n-1-k}d^{\,k}\\ &=b\Big(a^n+\sum_{k=0}^{n-1}a^{\,n-1-k}d^{\,k+1}\Big) =b\sum_{k=0}^{n}a^{\,n-k}d^{\,k} \end{aligned} $$ となり、$n\!\to\!n+1$ の形が得られる。初期値 $x_1=b\sum_{k=0}^{0}a^{0-k}d^k=b$ も満たすので完全帰納法により $$ x_n=b\sum_{k=0}^{n-1}a^{\,n-1-k}d^{\,k} $$ が証明された。ゆえに $$ T^n=\begin{pmatrix} a^n & b\sum_{k=0}^{n-1}a^{\,n-1-k}d^{\,k}\\[4pt] 0 & d^n \end{pmatrix} $$ が成立する。

和 $\displaystyle S_{n-1}(a,d)=\sum_{k=0}^{n-1}a^{\,n-1-k}d^{\,k}$ は
– $a\ne d$ のとき $$ S_{n-1}(a,d)=a^{\,n-1}\sum_{k=0}^{n-1}\Big(\frac{d}{a}\Big)^k =a^{\,n-1}\cdot\frac{1-(d/a)^{n}}{1-d/a} =\frac{a^{n}-d^{n}}{a-d} $$ – $a=d$ のとき $$ S_{n-1}(a,a)=\sum_{k=0}^{n-1}a^{\,n-1}=n\,a^{\,n-1} $$ よって 題意成立。
証明をみる (ジョルダン標準形の観点) $a=d=\lambda$ のとき $$ T=\begin{pmatrix}\lambda&b\\0&\lambda\end{pmatrix} =\lambda I+\begin{pmatrix}0&b\\0&0\end{pmatrix} =\lambda I + N,\quad N^2=0 $$ $N$ が冪零($N^2=0$)なので二項定理から $$ T^n=(\lambda I+N)^n=\sum_{r=0}^{n}\binom{n}{r}\lambda^{\,n-r}N^{r} =\lambda^{\,n}I+n\lambda^{\,n-1}N =\begin{pmatrix}\lambda^n&n\lambda^{\,n-1}b\\0&\lambda^n\end{pmatrix} $$ が直ちに得られ、先の結果と一致する。
具体例をみる $a=2,\ b=3,\ d=5,\ n=3$ とする。 公式より $$ T^3=\begin{pmatrix} 2^3 & 3\cdot\frac{2^3-5^3}{2-5}\\ 0 & 5^3 \end{pmatrix} =\begin{pmatrix} 8 & 3\cdot\frac{8-125}{-3}\\ 0 & 125 \end{pmatrix} =\begin{pmatrix} 8 & 117\\ 0 & 125 \end{pmatrix} $$ 直接計算(省略)でも同じ結果になる。

(4) 回転行列の場合

回転行列のn乗
$$ R(\theta)^n=R(n\theta). $$

証明をみる $R(\theta)R(\phi)=R(\theta+\phi)$ を帰納適用。あるいは複素表示 $e^{i\theta}$ の $n$ 乗から従う。$\square$

(5) 対角化可能な場合

対角化可能な行列のn乗
$A$が$A$の固有ベクトルを並べた$P$によって対角行列$D$に変換可能である場合、すなわち$A=PDP^{-1}$と表現できる場合、 $$ A^n=PD^{n}P^{-1} $$

証明をみる $A^n=(PDP^{-1})^n=(PDP^{-1})\cdots(PDP^{-1})=PD^{n}P^{-1}$ と明らか。
具体例をみる 次の上三角行列を考えます(固有値が 3 と 2 で異なるため,必ず対角化可能): $$ A=\begin{pmatrix}3&1\\0&2\end{pmatrix}. $$
1. 固有値と固有ベクトル
特性多項式は $$ \det(A-\lambda I)=\det\begin{pmatrix}3-\lambda&1\\0&2-\lambda\end{pmatrix}=(3-\lambda)(2-\lambda). $$ したがって固有値は $$ \lambda_1=3,\qquad \lambda_2=2. $$
各固有値に対する固有ベクトルを求めます。
– $\lambda=3$ のとき: $$ (A-3I)\mathbf{v}=\begin{pmatrix}0&1\\0&-1\end{pmatrix}\mathbf{v}=\mathbf{0}\ \Rightarrow\ y=0. $$ よって $\mathbf{v}_1=\begin{pmatrix}1\\0\end{pmatrix}$ を取る。

– $\lambda=2$ のとき: $$ (A-2I)\mathbf{v}=\begin{pmatrix}1&1\\0&0\end{pmatrix}\mathbf{v}=\mathbf{0}\ \Rightarrow\ x+y=0. $$ よって $\mathbf{v}_2=\begin{pmatrix}-1\\1\end{pmatrix}$ を取る(あるいは比例ベクトルでも可)。
2. 対角化(固有値分解)
固有ベクトルを列に並べて $$ P=\bigl[\mathbf{v}_1\ \mathbf{v}_2\bigr]=\begin{pmatrix}1&-1\\0&1\end{pmatrix},\qquad D=\begin{pmatrix}3&0\\0&2\end{pmatrix}. $$ このとき $$ A=PDP^{-1}. $$ $P$ は三角行列なので逆行列は容易に $$ P^{-1}=\begin{pmatrix}1&1\\0&1\end{pmatrix}. $$ 実際に確認すると $$ PDP^{-1} =\begin{pmatrix}1&-1\\0&1\end{pmatrix}\begin{pmatrix}3&0\\0&2\end{pmatrix}\begin{pmatrix}1&1\\0&1\end{pmatrix} =\begin{pmatrix}3&1\\0&2\end{pmatrix}=A. $$
3. $A^n$ の計算
固有値分解の基本公式 $A^n=PD^nP^{-1}$ を用いる: $$ D^n=\begin{pmatrix}3^n&0\\0&2^n\end{pmatrix}. $$ まず $PD^n$ を計算: $$ PD^n=\begin{pmatrix}1&-1\\0&1\end{pmatrix}\begin{pmatrix}3^n&0\\0&2^n\end{pmatrix} =\begin{pmatrix}3^n&-2^n\\0&2^n\end{pmatrix}. $$ つづいて $A^n=(PD^n)P^{-1}$: $$ A^n=\begin{pmatrix}3^n&-2^n\\0&2^n\end{pmatrix}\begin{pmatrix}1&1\\0&1\end{pmatrix} =\begin{pmatrix} 3^n&3^n-2^n\\ 0&2^n \end{pmatrix}. $$
4. 検算($n=1,2$) – $n=1$:$A^1=\begin{pmatrix}3&1\\0&2\end{pmatrix}$(一致)。
– $n=2$:公式より $$ A^2=\begin{pmatrix}3^2&3^2-2^2\\0&2^2\end{pmatrix} =\begin{pmatrix}9&5\\0&4\end{pmatrix}, $$ 一方で直接計算しても $$ \begin{pmatrix}3&1\\0&2\end{pmatrix}^2 =\begin{pmatrix}9&5\\0&4\end{pmatrix} $$ と一致。


結論(一般式)
$$ \boxed{\,A^n=\begin{pmatrix}3^n&3^n-2^n\\[2pt]0&2^n\end{pmatrix}\,} $$
固有値分解 $A=PDP^{-1}$ を用いると,$D^n$ は固有値を $n$ 乗するだけでよく,その後 $P$ と $P^{-1}$ で挟むだけで $A^n$ が得られる。

(6) 三角化可能(ジョルダン標準形)な場合

ジョルダン標準形に変形可能な行列のn乗
以下のように$A$を$A$の固有値に基づいた$J$によりジョルダン標準形に変形できる場合、 $$ A=PJP^{-1},\quad J=\begin{pmatrix}\lambda&1\\0&\lambda\end{pmatrix} =\lambda I+N,\ N=\begin{pmatrix}0&1\\0&0\end{pmatrix},\ N^2=O. $$ $A^n$は以下。 $$ \boxed{\,A^n=P(\lambda^n I+n\lambda^{n-1}N)P^{-1}\,}. $$

証明をみる $$ A=PJP^{-1},\quad J=\begin{pmatrix}\lambda&1\\0&\lambda\end{pmatrix} =\lambda I+N,\ N=\begin{pmatrix}0&1\\0&0\end{pmatrix},\ N^2=O. $$ 二項定理により $$ J^n=(\lambda I+N)^n=\sum_{k=0}^n\binom{n}{k}\lambda^{n-k}N^k =\lambda^n I+n\lambda^{n-1}N. $$ したがって $$ \boxed{\,A^n=P(\lambda^n I+n\lambda^{n-1}N)P^{-1}\,}. $$
具体例をみる ここでは,対角化できない具体例として $$ A=\begin{pmatrix}3&-1\\[2pt]1&1\end{pmatrix} $$ を扱い,ジョルダン標準形に相似変換してから $A^n$ を求めます。

1. 固有値と「対角化できない」ことの確認
特性多項式は $$ \chi_A(\lambda)=\det(A-\lambda I) =\det\begin{pmatrix}3-\lambda&-1\\[2pt]1&1-\lambda\end{pmatrix} =(3-\lambda)(1-\lambda)+1 =\lambda^2-4\lambda+4=(\lambda-2)^2. $$ 固有値は重複度 2 の $\lambda=2$ ただ一つです。

固有ベクトルは $(A-2I)\mathbf{x}=\mathbf{0}$ を解いて得ます: $$ A-2I=\begin{pmatrix}1&-1\\[2pt]1&-1\end{pmatrix},\qquad \begin{pmatrix}1&-1\\[2pt]1&-1\end{pmatrix}\begin{pmatrix}x\\y\end{pmatrix}=\begin{pmatrix}0\\0\end{pmatrix} \ \Rightarrow\ x-y=0. $$ したがって固有空間は $\mathrm{span}\{(1,1)^{\mathsf T}\}$ の 1 次元。**重複度 2 に対して固有ベクトルが 1 本しかない**ので,$A$ は対角化できません。


2. ジョルダン鎖(一般化固有ベクトル)の構成
固有ベクトルを $$ \mathbf{v}_1=\begin{pmatrix}1\\[2pt]1\end{pmatrix} $$ とします。次に一般化固有ベクトル $\mathbf{v}_2$ を $$ (A-2I)\mathbf{v}_2=\mathbf{v}_1 $$ を満たすように求めます。計算すると $$ \begin{pmatrix}1&-1\\[2pt]1&-1\end{pmatrix}\begin{pmatrix}x\\y\end{pmatrix} =\begin{pmatrix}1\\[2pt]1\end{pmatrix} \ \Rightarrow\ x-y=1. $$ ひとつの解として $\mathbf{v}_2=(1,0)^{\mathsf T}$ が取れます($1-0=1$)。

このとき $$ P=\bigl[\mathbf{v}_1\ \mathbf{v}_2\bigr] =\begin{pmatrix}1&1\\[2pt]1&0\end{pmatrix}, \qquad J=\begin{pmatrix}2&1\\[2pt]0&2\end{pmatrix} \quad(\text{2 次のジョルダンブロック}) $$ として $$ A=PJP^{-1} $$ が成り立ちます(下で確認します)。
$P$ の逆行列は $$ \det P=1\cdot0-1\cdot1=-1,\quad P^{-1}=\frac{1}{-1}\begin{pmatrix}0&-1\\[2pt]-1&1\end{pmatrix} =\begin{pmatrix}0&1\\[2pt]1&-1\end{pmatrix}. $$
**確認($A=PJP^{-1}$):**
まず $$ JP^{-1} =\begin{pmatrix}2&1\\[2pt]0&2\end{pmatrix}\begin{pmatrix}0&1\\[2pt]1&-1\end{pmatrix} =\begin{pmatrix}1&1\\[2pt]2&-2\end{pmatrix}, $$ ついで $$ P(JP^{-1}) =\begin{pmatrix}1&1\\[2pt]1&0\end{pmatrix}\begin{pmatrix}1&1\\[2pt]2&-2\end{pmatrix} =\begin{pmatrix}3&-1\\[2pt]1&1\end{pmatrix}=A. $$

3. ジョルダン標準形の $n$ 乗
$J$ は $\lambda=2$ のジョルダンブロックなので,$J=2I+N$ とおくと $$ N=\begin{pmatrix}0&1\\[2pt]0&0\end{pmatrix},\quad N^2=0. $$ 二項定理(ただし $N^2=0$ なので 2 次で止まる)から $$ J^n=(2I+N)^n=\sum_{r=0}^{n}\binom{n}{r}2^{\,n-r}N^r =2^n I+n\,2^{\,n-1}N =\begin{pmatrix}2^n&n\,2^{\,n-1}\\[2pt]0&2^n\end{pmatrix}. $$

4. $A^n=PJ^nP^{-1}$ の計算
まず $$ J^nP^{-1} =\begin{pmatrix}2^n&n\,2^{\,n-1}\\[2pt]0&2^n\end{pmatrix} \begin{pmatrix}0&1\\[2pt]1&-1\end{pmatrix} =\begin{pmatrix}n\,2^{\,n-1}&2^{\,n-1}(2-n)\\[2pt]2^n&-2^n\end{pmatrix}. $$ ついで $$ A^n=P(J^nP^{-1}) =\begin{pmatrix}1&1\\[2pt]1&0\end{pmatrix} \begin{pmatrix}n\,2^{\,n-1}&2^{\,n-1}(2-n)\\[2pt]2^n&-2^n\end{pmatrix} =\begin{pmatrix} 2^{\,n-1}(n+2)&-\,n\,2^{\,n-1}\\[4pt] n\,2^{\,n-1}&2^{\,n-1}(2-n) \end{pmatrix}. $$
**最終結果(簡潔形):**
$$ \boxed{\ A^n=2^{\,n-1}\begin{pmatrix}n+2&-n\\[2pt]n&2-n\end{pmatrix}\qquad(n\in\mathbb{N})\ } $$

5. 検算
– $n=1$:$2^{0}\begin{pmatrix}3&-1\\[2pt]1&1\end{pmatrix}=A$(一致)。
– $n=2$:$2^{1}\begin{pmatrix}4&-2\\[2pt]2&0\end{pmatrix} =\begin{pmatrix}8&-4\\[2pt]4&0\end{pmatrix}$。
直接計算でも $$ A^2=\begin{pmatrix}3&-1\\[2pt]1&1\end{pmatrix}^2 =\begin{pmatrix}8&-4\\[2pt]4&0\end{pmatrix} $$ で一致。

まとめ
対角化できない行列でも,ジョルダン標準形 $J$ を用いれば $$ A=PJP^{-1}\ \Rightarrow\ A^n=PJ^nP^{-1} $$ として明示的に $A^n$ を求められます。2×2 の場合,$J$ は 1 ブロックなので $$ J^n=\lambda^n I+n\,\lambda^{n-1}N\quad(N^2=0) $$ という簡潔な形で計算できます。

6. 対角行列と三角行列の性質

(1) 対角行列の逆行列(公式と証明)

対角行列の逆行列
$$ D=\operatorname{diag}(d_1,\dots,d_n),\ d_i\ne0\ \Rightarrow\ D^{-1}=\operatorname{diag}\Big(\frac1{d_1},\dots,\frac1{d_n}\Big). $$

証明をみる $DD^{-1}=\operatorname{diag}(d_1\cdot \tfrac1{d_1},\dots)=I$。逆も同様。$\square$

(2) 三角行列同士の積は三角行列(対角は積)

三角行列の積
上三角行列 $U,V$ に対し $UV$ も上三角行列で対角は $(u_{ii}v_{ii})$。

証明をみる $n\times n$ 行列 $U=(u_{ij})$,$V=(v_{ij})$ が**上三角**であるとは $$ u_{ij}=0\ (i>j),\qquad v_{ij}=0\ (i>j) $$ すなわち,主対角線より下の成分がすべて $0$ であることをいう。

このとき,積 $W=UV=(w_{ij})$ は上三角で,さらに $$ w_{ii}=u_{ii}\,v_{ii}\quad(1\le i\le n) $$ が成り立つことを示す。

証明(添字の条件を丁寧に追う)

積の成分は定義より $$ w_{ij}=(UV)_{ij}=\sum_{k=1}^{n}u_{ik}v_{kj}. $$
1) $W$ が上三角であること($i>j$ のとき $w_{ij}=0$)
上三角の条件を「非ゼロになりうる $k$ の範囲」として書き直すと
– $u_{ik}\ne0$ になりうるのは **$i\le k$**(行より列が右側)
– $v_{kj}\ne0$ になりうるのは **$k\le j$**(行が列の上)

よって $u_{ik}v_{kj}$ が**両方**非ゼロになりうるには $$ i\le k\le j $$ が必要。ところが今 $i>j$(主対角線より下)を仮定しているので,この不等式を満たす $k$ は**存在しない**。したがって和の各項がすべて $0$ になり $$ w_{ij}=0\qquad(i>j). $$ ゆえに $W$ は上三角。

2) 対角成分($i=j$)の式 $w_{ii}=u_{ii}v_{ii}$
同様に $$ w_{ii}=\sum_{k=1}^{n}u_{ik}v_{ki}. $$ ここで非ゼロになりうる条件を併せると
– $u_{ik}\ne0$ のためには **$i\le k$**
– $v_{ki}\ne0$ のためには **$k\le i$**

両方を同時に満たすには $$ i\le k\le i\ \Rightarrow\ k=i $$ しかない。したがって和には $k=i$ の項だけが残り $$ w_{ii}=u_{ii}\,v_{ii}. $$
以上で主張が示された。□
具体例をみる $$ U=\begin{pmatrix}u_{11}&u_{12}&u_{13}\\0&u_{22}&u_{23}\\0&0&u_{33}\end{pmatrix},\ V=\begin{pmatrix}v_{11}&v_{12}&v_{13}\\0&v_{22}&v_{23}\\0&0&v_{33}\end{pmatrix}. $$ このとき $$ UV=\begin{pmatrix} u_{11}v_{11}&u_{11}v_{12}+u_{12}v_{22}&u_{11}v_{13}+u_{12}v_{23}+u_{13}v_{33}\\ 0&u_{22}v_{22}&u_{22}v_{23}+u_{23}v_{33}\\ 0&0&u_{33}v_{33} \end{pmatrix}, $$ 確かに下三角はゼロ,対角は $(u_{11}v_{11},u_{22}v_{22},u_{33}v_{33})$ になっている。

(3) 三角行列の行列式は対角成分の積

三角行列の行列式
上三角 $U$ なら $$ \det U=\prod_{i=1}^n u_{ii}. $$

証明をみる (余因子展開+帰納法) 1. 帰納法の準備
$n=1$ のときは $\det[u_{11}]=u_{11}$ で主張は明らか。

$n-1$ 次について主張が正しいと仮定して、$n$ 次で示す。
2. 1列目で余因子展開
上三角なので 1 列目は $$ \begin{pmatrix}u_{11}&0&\cdots&0\end{pmatrix}^{\mathsf T} $$ となる。よって余因子展開の式から $$ \det U=u_{11}\cdot\det U^{(1)} $$ が得られる。ここで $U^{(1)}$ は $U$ の第 1 行・第 1 列を除いた $(n-1)\times(n-1)$ の小行列。 3. $U^{(1)}$ も上三角
$U$ が上三角なら、行と列を削った $U^{(1)}$ もやはり上三角で、その対角は $u_{22},u_{33},\dots,u_{nn}$ である。

仮定より $$ \det U^{(1)}=\prod_{i=2}^{n}u_{ii}. $$ したがって $$ \det U=u_{11}\cdot\det U^{(1)}=u_{11}\prod_{i=2}^{n}u_{ii}=\prod_{i=1}^{n}u_{ii}. $$
以上で $n$ に対しても成り立ち、帰納法で証明が完了。下三角の場合も 1 行目で余因子展開(または $U^{\mathsf T}$ を考える)により全く同様に示せる。
証明をみる (行列式の定義式から示す) 行列式の定義式(ライプニッツの公式)は $$ \det U=\sum_{\sigma\in S_n}\mathrm{sgn}(\sigma)\prod_{i=1}^{n}u_{i,\sigma(i)}. $$ 上三角では $u_{i,j}\neq 0$ となりうるのは $i\le j$ のときだけ。ところが、恒等置換 $\sigma=\mathrm{id}$ 以外の置換には必ずある $i$ が存在して $\sigma(i) < i$(「左にずれる」成分がある)。その $i$ に対しては $u_{i,\sigma(i)}=0$(対角より左なので 0)になり、対応する積は 0。

したがって 0 でない項は恒等置換の 1 項だけで $$ \det U=\prod_{i=1}^{n}u_{i,i}. $$ 下三角でも同様に、$\sigma(i)>i$ となる $i$ が生じるため、恒等置換以外は積に 0 を含み消える。よって結論は同じ。

7. 行列と漸化式

(1) 2 項間漸化式の行列による表現

2 項間漸化式
$$
u_{n+1}=a\,u_n+b\,u_{n-1}
$$

$$
\mathbf{v}_{n}=\begin{pmatrix}u_n\\u_{n-1}\end{pmatrix},\quad
\mathbf{v}_{n+1}=C\,\mathbf{v}_n,\ C=\begin{pmatrix}a&b\\1&0\end{pmatrix}
$$

と書くと $\mathbf{v}_{n}=C^{\,n}\mathbf{v}_0$($\mathbf{v}_0=(u_0,u_{-1})^T$)。初期条件が $u_0,u_1$ の場合は
$\mathbf{v}_1=(u_1,u_0)^T$ から $\mathbf{v}_{n} = C^{\,n-1}\mathbf{v}_1$。

(2) 2 項間漸化式の一般項

$C$ の特性多項式は
$$
\chi_C(\lambda)=\lambda^2-a\lambda-b.
$$
根を $\lambda_{1,2}$ とする。場合分け:

  • (重根でない)$\lambda_1\ne\lambda_2$:$C=P\operatorname{diag}(\lambda_1,\lambda_2)P^{-1}$ なので
    $$
    C^n=P\operatorname{diag}(\lambda_1^n,\lambda_2^n)P^{-1}.
    $$
    よって
    $$
    \boxed{\,u_n=\alpha\,\lambda_1^{\,n}+\beta\,\lambda_2^{\,n}\,},
    $$
    係数 $\alpha,\beta$ は初期条件 $u_0,u_1$ から
    $$
    \begin{pmatrix}1&1\\ \lambda_1&\lambda_2\end{pmatrix}\begin{pmatrix}\alpha\\ \beta\end{pmatrix}
    =\begin{pmatrix}u_0\\ u_1\end{pmatrix}\ \Rightarrow\
    \alpha=\frac{u_1-u_0\lambda_2}{\lambda_1-\lambda_2},\quad
    \beta=\frac{u_0\lambda_1-u_1}{\lambda_1-\lambda_2}.
    $$
  • (重根)$\lambda_1=\lambda_2=\lambda$:$C$ はジョルダン形 $J=\lambda I+N,\ N^2=O$ に相似で
    $$
    C^n\sim J^n=\lambda^n I+n\lambda^{n-1}N.
    $$
    したがって
    $$
    \boxed{\,u_n=(\alpha+\beta n)\lambda^{\,n}\,},
    $$
    係数は $u_0=\alpha,\ u_1=(\alpha+\beta)\lambda$ より $\alpha=u_0,\ \beta=\frac{u_1}{\lambda}-u_0$。

(3) 2 項間漸化式の簡単な解法

特性方程式 $\lambda^2-a\lambda-b=0$ を解き,解の型
$$
u_n=\begin{cases}
\alpha\,\lambda_1^n+\beta\,\lambda_2^n,& \lambda_1\ne\lambda_2,\\[2pt]
(\alpha+\beta n)\lambda^n,& \lambda_1=\lambda_2=\lambda
\end{cases}
$$
を仮定し,初期条件 $u_0,u_1$ から $\alpha,\beta$ を決定する。これは(2)での行列法の結果と一致する。$\square$

コメント