1. 固有値と固有ベクトル
(1) 固有値の定義
(2) 固有ベクトルの定義
ここで $\mathbf{v}=\mathbf{0}$ を除くのは、$A\mathbf{0}=\lambda\mathbf{0}$ が任意の $\lambda$ で自明に成り立ってしまうためである。
(3) 固有方程式の定義 (再掲)
具体例をみる
次の行列を考える: $$ A=\begin{pmatrix}2&1\\[2pt]1&2\end{pmatrix}. $$1. 固有値
$$ \det(A-\lambda I)= \det\begin{pmatrix}2-\lambda&1\\[2pt]1&2-\lambda\end{pmatrix} =(2-\lambda)^2-1=\lambda^2-4\lambda+3. $$ よって固有方程式 $\lambda^2-4\lambda+3=0$ の解は $\lambda=1,3$。
2. 固有ベクトル
$\lambda=3$ のとき $(A-3I)=\begin{pmatrix}-1&1\\[2pt]1&-1\end{pmatrix}$。
$-x+y=0$ から $y=x$。代表例として $(1,1)^{\mathsf T}$。
$\lambda=1$ のとき $(A-I)=\begin{pmatrix}1&1\\[2pt]1&1\end{pmatrix}$。
$x+y=0$ から $y=-x$。代表例として $(1,-1)^{\mathsf T}$。
よって $A$ は互いに直交する固有ベクトル $(1,1)^{\mathsf T},(1,-1)^{\mathsf T}$ をもち、対角化できる。
(4) 固有値に関する定理(1):固有値の和
証明をみる
$\mathbb{C}$ 上では任意の正方行列 $A$ はユニタリ行列 $U$ により $U^{-1}AU=T$ と上三角化できる(Schur の定理)。$T$ の対角成分は固有値 $\lambda_1,\dots,\lambda_n$。トレースは相似変換で不変なので $$ \mathrm{tr}(A)=\mathrm{tr}(T)=\lambda_1+\cdots+\lambda_n. $$ 以上。(別証)特性多項式 $p_A(\lambda)=\det(\lambda I-A)=\lambda^n-(\mathrm{tr}A)\lambda^{n-1}+\cdots$ の Viète の公式からも同結論。
(5) 固有値に関する定理(2):固有値の積
具体例をみる
上と同様に $U^{-1}AU=T$(上三角)。三角行列の行列式は対角成分の積なので $$ \det(A)=\det(T)=\lambda_1\cdots\lambda_n. $$ あるいは $p_A(0)=(-1)^n\det(A)$ と Viète からも従う。(6) 固有値に関する定理(3):転置行列の固有値
証明をみる
$\det(\lambda I-A^{\mathsf T})=\det\big((\lambda I-A)^{\mathsf T}\big)=\det(\lambda I-A)$。よって特性多項式が一致し、固有値も一致。(7) 固有値に関する定理(4):逆行列の固有値
証明をみる
$A\mathbf{v}=\lambda\mathbf{v}$ の両辺に $A^{-1}$ を左から掛けて $A^{-1}A\mathbf{v}=\mathbf{v}=\lambda A^{-1}\mathbf{v}$。ゆえに $A^{-1}\mathbf{v}=\lambda^{-1}\mathbf{v}$。(8) 固有値に関する定理(5):べき等行列の固有値
証明をみる
$A\mathbf{v}=\lambda\mathbf{v}$ に $A$ をもう一度掛けると $A^2\mathbf{v}=\lambda^2\mathbf{v}$。一方 $A^2\mathbf{v}=A\mathbf{v}=\lambda\mathbf{v}$。よって $(\lambda^2-\lambda)\mathbf{v}=\mathbf{0}$。$\mathbf{v}\neq\mathbf{0}$ なので $\lambda(\lambda-1)=0$、すなわち $\lambda\in{0,1}$。(9) 固有値に関する定理(6):固有値が相異なれば可逆(注意つき)
(注意)固有値が相異でも $0$ を含めば $\det(A)=0$ で可逆でない。例:$\mathrm{diag}(0,1)$ は固有値が相異だが非可逆。
2. 対角化・三角化
(1) 対角化・三角化に関する定理(1):行列の対角化
具体例をみる
$A=\begin{pmatrix}2&1\\[2pt]1&2\end{pmatrix}$ の固有値は ${1,3}$、固有ベクトルは $(1,-1)^{\mathsf T},(1,1)^{\mathsf T}$。 $$ P=\begin{pmatrix}1&1\\[2pt]-1&1\end{pmatrix},\quad D=\begin{pmatrix}1&0\\[2pt]0&3\end{pmatrix} $$ 従って、 $$ \begin{align} A &= PDP^{-1} \\ &= \frac{1}{2}\begin{pmatrix}1&1\\[2pt]-1&1\end{pmatrix} \begin{pmatrix}1&0\\[2pt]0&3\end{pmatrix} \begin{pmatrix}1&1\\[2pt]1&-1\end{pmatrix} \\ \end{align} $$(2) ジョルダン細胞の定義
(3) ジョルダン標準形
(4) 対角化・三角化に関する定理(2):ジョルダン細胞の作成
(5) 対角化・三角化に関する定理(3):ジョルダン細胞の大きさ
固有値 $\lambda$ ごとに $N_\lambda:=A-\lambda I$ を置き、$\nu_\lambda(k):=\dim\ker(N_\lambda^k)$ とする($\nu_\lambda(0):=0$)。このとき
さらに、サイズが「ちょうど」$k$ の個数は
よって $\{\nu_\lambda(k)\}_{k\ge1}$ を計算すれば、各固有値に対応するジョルダン細胞のサイズ分布が一意に定まる。
(6) 対角化・三角化に関する定理(4):ジョルダン細胞の作成
条件は定理Aと同じ。以下の手順で、$A$ のジョルダン細胞と基底を具体的に構成できる。
- 固有値の決定: 特性多項式 $\chi_A(x)=\det(xI-A)$ を $F$ 上で分解し、固有値の集合 $\{\lambda\}$ を得る。
-
各固有値に対する核次元列の計算: 固有値 $\lambda$ ごとに $N_\lambda=A-\lambda I$ を取り、$k=1,2,\dots$ について
$$\nu_\lambda(k)=\dim\ker(N_\lambda^k)$$を(階数計算または掃き出し法で)求める。定理Bにより $b_\lambda(k)=\nu_\lambda(k)-\nu_\lambda(k-1)$、$c_\lambda(k)=b_\lambda(k)-b_\lambda(k+1)$ を得る。
- 鎖の長さの決定: $c_\lambda(k)$ は「長さちょうど $k$ のジョルダン鎖の本数」を表す。よって固有値 $\lambda$ について、長さ $k$ の鎖を $c_\lambda(k)$ 本用意すればよい。
-
鎖の先頭(最高階一般化固有ベクトル)の選択:
最大の長さ $s$ から順に、補空間を選びながら次を行う。
- $\ker(N_\lambda^s)$ の中から $\ker(N_\lambda^{s-1})$ に属さないベクトルを $c_\lambda(s)$ 本、線形独立に選ぶ。これらを各鎖の「先頭」 $v^{(j)}_{s}$ とする。
- 次に $s-1$ について、$\ker(N_\lambda^{s-1})$ の中から $\ker(N_\lambda^{s-2})$ に属さないベクトルを、未充足の本数 $c_\lambda(s-1)$ だけ追加で選ぶ。以下 $k=1$ まで同様。
-
鎖の生成: 各先頭 $v^{(j)}_{s}$ から
$$v^{(j)}_{s-1}:=N_\lambda v^{(j)}_{s},\ v^{(j)}_{s-2}:=N_\lambda v^{(j)}_{s-1},\ \dots,\ v^{(j)}_{1}:=N_\lambda v^{(j)}_{2}$$と定めると、長さ $s$ のジョルダン鎖$$N_\lambda v^{(j)}_{1}=0,\quad N_\lambda v^{(j)}_{r}=v^{(j)}_{r-1}\ (r=2,\dots,s)$$が得られる。
-
ジョルダン基底とジョルダン細胞:
固有値 $\lambda$ ごとに得られた全鎖のベクトルを
$$\big\{v^{(j)}_{1},\dots,v^{(j)}_{s_j}\big\}_{j}\ \text{(各鎖ごとに先頭から順に並べる)}$$の順で並べると、その合体が $F^n$ の基底(ジョルダン基底)になる。この基底での $A$ の行列表現は、各鎖ごとに $J_{s_j}(\lambda)$ を対角ブロックにもつジョルダン標準形 $J$ となる。すなわち$$A=PJP^{-1}$$を与える可逆行列 $P$ は、これら基底ベクトルを列に並べたものとして具体的に作れる。
証明の要点(なぜこの構成でジョルダン細胞になるか)
- 核次元の増加分=ブロック本数: $b_\lambda(k)=\nu_\lambda(k)-\nu_\lambda(k-1)$ は、$N_\lambda^k$ の核に新たに入ってくる独立なベクトルの本数であり、これは「サイズ少なくとも $k$ の鎖の本数」に一致する($N_\lambda$ の作用で鎖の先頭が核に落ちる階数が増えるため)。
- 鎖の再帰生成: $N_\lambda v_{r}=v_{r-1}$ の再帰で並べたベクトル列は、基底における $A$ の行列表現を
$$A=\lambda I+N_\lambda$$の形で「対角に $\lambda$、超対角に $1$」というジョルダン細胞の形にする。
- 独立性と全体の張り: 段階ごとに補空間から取ることで、異なる鎖の先頭は互いに独立に選べ、鎖全体が基底の大きさ $n$ を満たすことは次元計算($\sum_\lambda \nu_\lambda(\infty)=n$)で保証される。
具体例をみる
行列の用意
次の実行列 $A$ を扱います。
ステップ1:特性多項式と固有値
特性多項式は $\chi_A(\lambda)=\det(\lambda I-A)$ です。
したがって固有値は $\lambda=2$(重複度2)、$\lambda=3$(重複度1)。
ステップ2:固有空間の計算
(a)$\lambda=2$ の固有ベクトル
$(A-2I)\,x=0$ を解く。方程式は $y=0$、$-x+y+z=0$(すなわち $z=x$)。 よって一次独立な解は
これが $\lambda=2$ の固有ベクトル(固有空間は一次元)。
(b)$\lambda=3$ の固有ベクトル
$(A-3I)\,x=0$ を解くと $-x+y=0$、$-y=0$ から $x=y=0$、$z$ は自由。 したがって
が $\lambda=3$ の固有ベクトル(固有空間は一次元)。
ステップ3:$\lambda=2$ の一般化固有ベクトル(長さ2のジョルダン鎖)
$\lambda=2$ の代数的重複度は2ですが固有空間は一次元なので、 サイズ2のジョルダン細胞が1つ現れます。 そのため、$(A-2I)w=v$ を満たすベクトル $w$(一般化固有ベクトル)を求めます。
成分で書くと $y=1$、$-x+y+z=1$。 簡単のため $x=0,\ z=0$ と選べば $y=1$ を満たします。よって
すると $$A v=2v,\qquad A w=2w+v$$ が成り立ち、 $(v,w)$ は $\lambda=2$ に対する長さ2のジョルダン鎖をなします。
ステップ4:ジョルダン基底・変換行列 $P$・標準形 $J$
ジョルダン基底として、鎖の順(固有→一般化)で $\{v,w\}$、 および $\lambda=3$ の固有ベクトル $u$ を並べます。
この基底に関する $A$ の表現は、列ベクトルの対応 $$A v=2v,\quad A w=v+2w,\quad A u=3u$$ より、
となり、確かにジョルダン標準形($\lambda=2$ のジョルダン細胞 $J_2(2)$ と、 $\lambda=3$ のサイズ1細胞)が得られます。
検算($AP=PJ$)
列ごとに確認します:
- 第1列:$A v=2v=$ 第1列の $P$ に $J$ の第1列 $(2,0,0)^\top$ を作用 → 一致。
- 第2列:$A w=v+2w=$ 第2列の $P$ に $J$ の第2列 $(1,2,0)^\top$ を作用 → 一致。
- 第3列:$A u=3u=$ 第3列の $P$ に $J$ の第3列 $(0,0,3)^\top$ を作用 → 一致。
まとめ
- $\chi_A(\lambda)=(\lambda-3)(\lambda-2)^2$、 幾何的重複度 $\dim\ker(A-2I)=1$ より、 $\lambda=2$ に対してサイズ2のジョルダン細胞が1つ。
- 固有ベクトル $v=(1,0,1)^\top$、 一般化固有ベクトル $w=(0,1,0)^\top$、 $\lambda=3$ の固有ベクトル $u=(0,0,1)^\top$ を並べた $P$ により、 $$J=P^{-1}AP=\begin{pmatrix}2&1&0\\0&2&0\\0&0&3\end{pmatrix}$$ を得た。
(5) 対角化・三角化に関する定理(3):行列の上三角化
証明をみる
ベクトル空間 $V=F^n$ 上の線形写像 $T:V\to V$ を $A$ の作用として考える($T$ の行列表現が $A$)。
-
基底の取り方:固有ベクトルを先頭に置く
特性多項式が分解する仮定より、$T$ は固有値 $\lambda_1\in F$ と固有ベクトル $v_1\ne 0$ をもつ($T(v_1)=\lambda_1 v_1$)。$v_1$ を先頭にして基底に延長する:$$\mathcal{B}=\{v_1,v_2,\dots,v_n\}.$$この基底に関する $T$ の行列表現を $\tilde A=[T]_{\mathcal{B}}$ とする。 -
この基底での行列表現はブロック上三角になる
まず$$T(v_1)=\lambda_1 v_1\quad\Rightarrow\quad\tilde A\text{ の第1列}=\begin{pmatrix}\lambda_1\\0\\ \vdots\\ 0\end{pmatrix}.$$一方、$j\ge 2$ に対しては$$T(v_j)=\alpha_{1j}v_1+\sum_{i=2}^n \alpha_{ij}v_i.$$したがって $\tilde A$ は$$\tilde A=\begin{pmatrix} \lambda_1 & * \\ 0 & A_1 \end{pmatrix}$$という形(左下ブロックが $0$ のブロック上三角形)になる。ここで $A_1$ は $T$ が商空間 $V/\langle v_1\rangle$ に誘導する作用(あるいは $v_1$ を除いた基底部分に対する作用)の $(n-1)\times(n-1)$ 行列表現。 -
帰納法の適用
次元 $n=1$ は自明。$n-1$ 次で定理が成り立つと仮定すると、$A_1$ は同じ体 $F$ 上で上三角化できる。すなわち、可逆な $(n-1)\times(n-1)$ 行列 $S$ が存在して$$S^{-1}A_1S=\text{上三角行列}$$となる。 -
全体の相似変換に組み込む
ブロック対角の可逆行列$$Q=\begin{pmatrix}1&0\\0&S\end{pmatrix}$$を用いると$$Q^{-1}\tilde A\,Q=\begin{pmatrix} \lambda_1 & *\\ 0 & S^{-1}A_1S \end{pmatrix}$$は、右下ブロックが上三角、左上はスカラー $\lambda_1$、左下は $0$ なので全体として上三角行列である。 -
元の $A$ への戻し
基底変換行列 $P=[v_1\,v_2\,\dots\,v_n]$ は可逆で、$P^{-1}AP=\tilde A$。よって$$(PQ)^{-1}A(PQ)=Q^{-1}\tilde A\,Q$$は上三角行列。これで $A$ が上三角化できることが示された。□
反例をみる
補足2:反例(分解しない場合)
体が $\mathbb{R}$、行列が回転行列 $$R=\begin{pmatrix}\cos\theta&-\sin\theta\\ \sin\theta&\cos\theta\end{pmatrix}\quad(0<\theta<\pi,\ \theta\ne\pi/2)$$ などでは、固有値が実数に存在しない(複素数にしかない)ため、$\mathbb{R}$ 上では三角化できません(ただし $\mathbb{C}$ 上に拡張すれば可能)。
具体例をみる
目標
具体的な $3\times3$ 行列を一つ取り、その行列を基底の取り替え(相似変換)で上三角化する過程を、固有値・固有ベクトルから丁寧に示します。対角化できればそれは上三角化の特別な場合(対角は上三角)です。
ステップ0:行列の用意(コンパニオン行列の具体例)
次の $A$ を扱います。これは多項式 $x^3-6x^2+11x-6$ に対応するコンパニオン行列で、固有値が $1,2,3$ と分かれているため対角化が可能です。
ステップ1:特性多項式と固有値の計算
特性多項式は $\det(\lambda I-A)$ です。ここでは行列式を展開して求めます。
因数分解すると
ゆえに固有値は $1,2,3$ です。
ステップ2:固有ベクトルの構成と検算
このタイプの行列(コンパニオン行列)では、各固有値 $\lambda$ に対して
が固有ベクトルになることが知られています。実際に $A v(\lambda)=\lambda v(\lambda)$ を確認します:
右辺の最下段が $\lambda^3$ に等しければ良いのですが、固有値 $\lambda$ は特性多項式の根なので
よって $Av(\lambda)=\lambda v(\lambda)$ が成り立ちます。
具体的に、三つの固有値に対する固有ベクトルを選びます:
ステップ3:基底行列 $P$ と対角行列(上三角行列)$D$ の構成
固有ベクトルを列に並べて基底変換行列 $P$ を作り、固有値を対角に並べた $D$ を作ります。
まず $P$ が可逆(列が一次独立)であることを確認しておきます(行列式を計算):
ステップ4:$AP=PD$ を確かめ、$P^{-1}AP=D$ を結論する
各列について $A v_i=\lambda_i v_i$ が成立するので、列をまとめれば
となります。$P$ は可逆なので、両辺の左から $P^{-1}$ を掛けて
を得ます。右辺 $D$ は対角行列であり、もちろん上三角行列です。これにより、$A$ は相似変換で上三角化(実際は対角化)できることが明示的に示されました。
ステップ5:まとめ(上三角化の要点)
- 固有値が体上に揃い(ここでは $1,2,3$)、固有ベクトルが一次独立なら、$P$ を固有ベクトルで作って $P^{-1}AP=D$ とできる。
- $D$ は対角行列なので、特に「上三角化」にもなっている。
- 今回は $P$ の可逆性も行列式で具体的に確認した($\det P=2\ne0$)。
3. $m$ 次正方行列の $n$ 乗
(1) 相異なる $m$ 本の固有ベクトルが存在①(= 相異なる固有値が $m$ 個)
証明をみる
具体例をみる
$$ A=\begin{pmatrix}1&1&0\\[2pt]0&2&0\\[2pt]0&0&3\end{pmatrix}. $$ 固有値は $1,2,3$(相異)。固有ベクトルは $$ \lambda=1:\ (1,0,0)^{\mathsf T},\quad \lambda=2:\ (1,1,0)^{\mathsf T},\quad \lambda=3:\ (0,0,1)^{\mathsf T}. $$ よって $$ P=\begin{pmatrix}1&1&0\\[2pt]0&1&0\\[2pt]0&0&1\end{pmatrix},\ P^{-1}=\begin{pmatrix}1&-1&0\\[2pt]0&1&0\\[2pt]0&0&1\end{pmatrix},\ D=\mathrm{diag}(1,2,3). $$ このとき $$ A^n=P\,\mathrm{diag}(1^n,2^n,3^n)\,P^{-1} =\begin{pmatrix}1&1&0\\[2pt]0&1&0\\[2pt]0&0&1\end{pmatrix} \begin{pmatrix}1&0&0\\[2pt]0&2^n&0\\[2pt]0&0&3^n\end{pmatrix} \begin{pmatrix}1&-1&0\\[2pt]0&1&0\\[2pt]0&0&1\end{pmatrix}. $$ 積を実行すると $$ A^n= \begin{pmatrix} 1 & 2^n-1 & 0\\[2pt] 0 & 2^n & 0\\[2pt] 0 & 0 & 3^n \end{pmatrix}. $$(2) 重解はあるが $m$ 本の固有ベクトルが存在②(= 対角化可能)
証明をみる
具体例をみる
$$ A=\mathrm{diag}(2,2,3). $$ 固有値 $2$(重複 2)と $3$。固有ベクトルは標準基底 $\mathbf{e}_1,\mathbf{e}_2,\mathbf{e}_3$ がそのまま 3 本あり、対角化済み。ゆえに $$ A^n=\mathrm{diag}(2^n,2^n,3^n). $$(3) 相異なる $m-1$ 本の固有ベクトルが存在(ジョルダンブロック 2 が 1 つ)
$J_2(\lambda)=\lambda I+N$($N^2=0$)より二項展開 $$ J_2(\lambda)^n=(\lambda I+N)^n=\lambda^n I+n\lambda^{n-1}N =\begin{pmatrix}\lambda^n&n\lambda^{n-1}\\[2pt]0&\lambda^n\end{pmatrix}. $$
具体例をみる
(4) 相異なる $m-2$ 本の固有ベクトルが存在(ジョルダンブロック 3 など)
$$ J_3(\lambda)^n=\sum_{r=0}^{2}\binom{n}{r}\lambda^{\,n-r}N^r =\begin{pmatrix} \lambda^n & \binom{n}{1}\lambda^{n-1} & \binom{n}{2}\lambda^{n-2}\\ 0&\lambda^n&\binom{n}{1}\lambda^{n-1}\\ 0&0&\lambda^n \end{pmatrix}. $$
具体例をみる
$$ A=\begin{pmatrix}2&1&0\\[2pt]0&2&1\\[2pt]0&0&2\end{pmatrix}=J_3(2). $$ よって $$ A^n=\begin{pmatrix} 2^n & n\,2^{n-1} & \binom{n}{2}2^{n-2}\\[2pt] 0 & 2^n & n\,2^{n-1}\\[2pt] 0 & 0 & 2^n \end{pmatrix}. $$(6) ジョルダン標準形の発想(一般化固有ベクトルの鎖)
固有ベクトルが足りないとき、$\lambda$ に対し
$$
(A-\lambda I)\mathbf{v}_1=\mathbf{0},\quad
(A-\lambda I)\mathbf{v}_2=\mathbf{v}_1,\quad
(A-\lambda I)\mathbf{v}_3=\mathbf{v}_2,\ \dots
$$
を満たす列 $\mathbf{v}_1,\mathbf{v}_2,\dots$ を作る(ジョルダン鎖)。この基底での行列表現が $J_k(\lambda)$。
直感的には、$(A-\lambda I)$ は「1 つずつ手前のベクトルへ送る」作用で、上超対角の 1 がその働きを表す。鎖の長さがブロックの大きさを与える。
コメント