固有値と固有ベクトル

バイオインフォ基礎

1. 固有値と固有ベクトル

(1) 固有値と固有ベクトルの定義

  • 固有値の定義:$A$ を $n\times n$ 行列とする。$A$ に対し、$A\mathbf{v}=\lambda \mathbf{v}$ を満たすスカラー $\lambda\in\mathbb{F}$($\mathbb{F}=\mathbb{R}$ または $\mathbb{C}$)があるとき、$\lambda$ を $A$ の固有値(eigenvalue)という。
  • 固有ベクトルの定義:上の式を満たす $\mathbf{v}\neq \mathbf{0}$ を $\lambda$ に対応する固有ベクトル(eigenvector)という。
    ここで $\mathbf{v}=\mathbf{0}$ を除くのは、$A\mathbf{0}=\lambda\mathbf{0}$ が任意の $\lambda$ で自明に成り立ってしまうためである。

(2) 固有値と固有ベクトルの求め方

  • 固有方程式:$A\mathbf{v}=\lambda\mathbf{v}$ は $(A-\lambda I)\mathbf{v}=\mathbf{0}$ に同値。非零解 $\mathbf{v}$ をもつための必要十分条件は
    $$
    \det(A-\lambda I)=0.
    $$
    この方程式を 固有方程式(特性方程式)と呼び、$p_A(\lambda):=\det(\lambda I-A)$(または $\det(A-\lambda I)$)を 特性多項式 という。
  • 手順(概略)
  1. $\det(A-\lambda I)=0$ を解いて固有値 $\lambda$(重複度込み)を求める。
  2. 各固有値 $\lambda$ について、連立方程式 $(A-\lambda I)\mathbf{v}=\mathbf{0}$ を解き、固有ベクトル空間(固有空間)$E_\lambda:=\mathrm{Ker}(A-\lambda I)$ の基底を求める。

(3) 具体例

次の行列を考える:
$$
A=\begin{pmatrix}2&1\\[2pt]1&2\end{pmatrix}.
$$

  1. 固有値
    $$
    \det(A-\lambda I)=
    \det\begin{pmatrix}2-\lambda&1\\[2pt]1&2-\lambda\end{pmatrix}
    =(2-\lambda)^2-1=\lambda^2-4\lambda+3.
    $$
    よって固有方程式 $\lambda^2-4\lambda+3=0$ の解は $\lambda=1,3$。
  2. 固有ベクトル
  • $\lambda=3$ のとき $(A-3I)=\begin{pmatrix}-1&1\\[2pt]1&-1\end{pmatrix}$。
    $-x+y=0$ から $y=x$。代表例として $(1,1)^{\mathsf T}$。
  • $\lambda=1$ のとき $(A-I)=\begin{pmatrix}1&1\\[2pt]1&1\end{pmatrix}$。
    $x+y=0$ から $y=-x$。代表例として $(1,-1)^{\mathsf T}$。
    よって $A$ は互いに直交する固有ベクトル $(1,1)^{\mathsf T},(1,-1)^{\mathsf T}$ をもち、対角化できる。

2. 公式

(1) 固有値の和=トレース

  • 主張:固有値(重複度込み)の和は $\mathrm{tr}(A)$ に等しい。
  • 証明(Schur 上三角化/三角行列の性質):$\mathbb{C}$ 上では任意の正方行列 $A$ はユニタリ行列 $U$ により $U^{-1}AU=T$ と上三角化できる(Schur の定理)。$T$ の対角成分は固有値 $\lambda_1,\dots,\lambda_n$。トレースは相似変換で不変なので
    $$
    \mathrm{tr}(A)=\mathrm{tr}(T)=\lambda_1+\cdots+\lambda_n.
    $$
    以上。
    (別証)特性多項式 $p_A(\lambda)=\det(\lambda I-A)=\lambda^n-(\mathrm{tr}A)\lambda^{n-1}+\cdots$ の Viète の公式からも同結論。

(2) 固有値の積=行列式

  • 主張:固有値(重複度込み)の積は $\det(A)$ に等しい。
  • 証明:上と同様に $U^{-1}AU=T$(上三角)。三角行列の行列式は対角成分の積なので
    $$
    \det(A)=\det(T)=\lambda_1\cdots\lambda_n.
    $$
    あるいは $p_A(0)=(-1)^n\det(A)$ と Viète からも従う。

(3) 転置行列の固有値

  • 主張:$A$ と $A^{\mathsf T}$ は同じ固有値(重複度込み)をもつ。
  • 証明:$\det(\lambda I-A^{\mathsf T})=\det\big((\lambda I-A)^{\mathsf T}\big)=\det(\lambda I-A)$。よって特性多項式が一致し、固有値も一致。

(4) 逆行列の固有値

  • 主張:$A$ が可逆で、$A\mathbf{v}=\lambda\mathbf{v}$($\mathbf{v}\neq\mathbf{0}$)なら、$A^{-1}\mathbf{v}=\lambda^{-1}\mathbf{v}$。
  • 証明:$A\mathbf{v}=\lambda\mathbf{v}$ の両辺に $A^{-1}$ を左から掛けて $A^{-1}A\mathbf{v}=\mathbf{v}=\lambda A^{-1}\mathbf{v}$。ゆえに $A^{-1}\mathbf{v}=\lambda^{-1}\mathbf{v}$。

(5) べき等行列の固有値

  • 主張:$A^2=A$(べき等)なら固有値は $0$ か $1$。
  • 証明:$A\mathbf{v}=\lambda\mathbf{v}$ に $A$ をもう一度掛けると $A^2\mathbf{v}=\lambda^2\mathbf{v}$。一方 $A^2\mathbf{v}=A\mathbf{v}=\lambda\mathbf{v}$。よって $(\lambda^2-\lambda)\mathbf{v}=\mathbf{0}$。$\mathbf{v}\neq\mathbf{0}$ なので $\lambda(\lambda-1)=0$、すなわち $\lambda\in{0,1}$。

(6) 固有値が相異なれば可逆(注意つき)

  • 主張(注意を加えて明確化):$A$ の全ての固有値が相異で、かつ $0$ を含まないとき、$A$ は可逆。
    (注意)固有値が相異でも $0$ を含めば $\det(A)=0$ で可逆でない。例:$\mathrm{diag}(0,1)$ は固有値が相異だが非可逆。
  • 証明:固有値の積が $\det(A)$ に等しい((2))。全て相異かつ $0$ を含まないなら積は $0$ でなく、$\det(A)\neq 0$。ゆえに $A$ は可逆。

3. 対角化

(1) 対角化

  • 定義:$A$ が対角化可能とは、可逆行列 $P$ と対角行列 $D$ が存在して
    $$
    A=PDP^{-1}
    $$
    と表せること。$D$ の対角は固有値、$P$ の列は対応する固有ベクトルからなる。
  • 手順
  1. 固有値を(重複度込みで)求める。
  2. 各固有値ごとに固有空間 $E_\lambda=\mathrm{Ker}(A-\lambda I)$ の基底を求める。
  3. 得た固有ベクトルが $n$ 本(線形独立)あれば $P$ をそれらを列に並べて作り、$D=\mathrm{diag}(\lambda_1,\dots,\lambda_n)$ とする。
  • :$A=\begin{pmatrix}2&1\\[2pt]1&2\end{pmatrix}$ の固有値は ${1,3}$、固有ベクトルは $(1,-1)^{\mathsf T},(1,1)^{\mathsf T}$。
    $$
    P=\begin{pmatrix}1&1\\[2pt]-1&1\end{pmatrix},\quad
    D=\begin{pmatrix}1&0\\[2pt]0&3\end{pmatrix}
    $$
    従って、
    $$
    \begin{align}
    A &= PDP^{-1} \\
    &= \frac{1}{2}\begin{pmatrix}1&1\\[2pt]-1&1\end{pmatrix} \begin{pmatrix}1&0\\[2pt]0&3\end{pmatrix}
    \begin{pmatrix}1&1\\[2pt]1&-1\end{pmatrix} \\
    \end{align}
    $$

(2) ジョルダン標準形

  • ジョルダン細胞(ブロック):固有値 $\lambda$ に対する $k$ 次のジョルダン細胞
    $$
    J_k(\lambda)=
    \begin{pmatrix}
    \lambda&1& &&0\\
    &\lambda&1&&\\
    &&\ddots&\ddots&\\
    &&&\lambda&1\\
    0&&&&\lambda
    \end{pmatrix}
    $$
    と書く(上超対角に 1、他は 0)。
  • ジョルダン標準形:ある可逆 $P$ が存在して
    $$
    P^{-1}AP=\mathrm{diag}\big(J_{k_1}(\lambda_1),\dots,J_{k_r}(\lambda_r)\big)
    $$
    となるとき、右辺を $A$ のジョルダン標準形という($\mathbb{C}$ 上で常に存在)。
  • 作り方(概略):各固有値 $\lambda$ について、$(A-\lambda I)$ の階数落ちから 一般化固有空間 を求め、鎖(チェイン)
    $$
    (A-\lambda I)\mathbf{v}_1=\mathbf{0},\quad (A-\lambda I)\mathbf{v}_2=\mathbf{v}_1,\quad \dots
    $$
    を組むと、その鎖が $J_k(\lambda)$ に対応する基底を与える。
  • 例($2\times2$,重根で非対角化)
    $$
    A=\begin{pmatrix}2&1\\[2pt]0&2\end{pmatrix}
    $$
    の固有値は $\lambda=2$(重複 2)。固有空間は $\mathrm{Ker}(A-2I)=\mathrm{span}{(1,0)^{\mathsf T}}$(次元 1)なので対角化不可。
    一般化固有ベクトル $\mathbf{v}_2$ を $(A-2I)\mathbf{v}_2=\mathbf{v}_1$($\mathbf{v}_1=(1,0)^{\mathsf T}$)で求める。例えば $\mathbf{v}_2=(0,1)^{\mathsf T}$。
    基底 $P=[\mathbf{v}_1\ \mathbf{v}_2]$ によって $P^{-1}AP=J_2(2)$ となる。

(3) 上三角化

  • 事実:$\mathbb{C}$ 上で任意の $A$ は相似変換で上三角にできる(Schur)。初学者向けには次の帰納的説明も有効:
  1. $A$ は少なくとも 1 つの固有値 $\lambda$ を持つ(代数の基本定理)。その固有ベクトル $\mathbf{v}_1$ を含む基底に変えると、$A$ の行列表現は
    $$
    \begin{pmatrix}
    \lambda & * & \cdots & *\\
    0 & & & \\
    \vdots & & A’ & \\
    0 & & &
    \end{pmatrix}
    $$
    となる($*$ は何かしらの数)。
  2. 同様に $A’$ に対しても固有ベクトルを取り、基底を拡張していくと上三角化が得られる。
  • 例($2\times2$):$A=\begin{pmatrix}1&1\\[2pt]0&2\end{pmatrix}$ はすでに上三角で、対角に固有値 $1,2$ が並ぶ。

4. $m$ 次正方行列の $n$ 乗

以下、$n\in\mathbb{N}$ を乗数(指数)、行列のサイズは状況に応じて明記する。

(1) 相異なる $m$ 本の固有ベクトルが存在①(= 相異なる固有値が $m$ 個)

  • 方針:$A$ が $m$ 本の線形独立な固有ベクトルを持つ(すなわち対角化可能)なら
    $$
    A=PDP^{-1}\ \Rightarrow\ A^n=PD^nP^{-1},\qquad D^n=\mathrm{diag}(\lambda_1^n,\dots,\lambda_m^n).
    $$
  • 具体例($3\times3$)
    $$
    A=\begin{pmatrix}1&1&0\\[2pt]0&2&0\\[2pt]0&0&3\end{pmatrix}.
    $$
    固有値は $1,2,3$(相異)。固有ベクトルは
    $$
    \lambda=1:\ (1,0,0)^{\mathsf T},\quad
    \lambda=2:\ (1,1,0)^{\mathsf T},\quad
    \lambda=3:\ (0,0,1)^{\mathsf T}.
    $$
    よって
    $$
    P=\begin{pmatrix}1&1&0\\[2pt]0&1&0\\[2pt]0&0&1\end{pmatrix},\
    P^{-1}=\begin{pmatrix}1&-1&0\\[2pt]0&1&0\\[2pt]0&0&1\end{pmatrix},\
    D=\mathrm{diag}(1,2,3).
    $$
    このとき
    $$
    A^n=P\,\mathrm{diag}(1^n,2^n,3^n)\,P^{-1}
    =\begin{pmatrix}1&1&0\\[2pt]0&1&0\\[2pt]0&0&1\end{pmatrix}
    \begin{pmatrix}1&0&0\\[2pt]0&2^n&0\\[2pt]0&0&3^n\end{pmatrix}
    \begin{pmatrix}1&-1&0\\[2pt]0&1&0\\[2pt]0&0&1\end{pmatrix}.
    $$
    積を実行すると
    $$
    A^n=
    \begin{pmatrix}
    1 & 2^n-1 & 0\\[2pt]
    0 & 2^n & 0\\[2pt]
    0 & 0 & 3^n
    \end{pmatrix}.
    $$

(2) 重解はあるが $m$ 本の固有ベクトルが存在②(= 対角化可能)

  • 方針:固有値に重複があっても、固有ベクトルが合計で $m$ 本(幾何重複度の和が $m$)あれば対角化可能で、(1) と同様に $A^n=PD^nP^{-1}$。
  • 具体例($3\times3$)
    $$
    A=\mathrm{diag}(2,2,3).
    $$
    固有値 $2$(重複 2)と $3$。固有ベクトルは標準基底 $\mathbf{e}_1,\mathbf{e}_2,\mathbf{e}_3$ がそのまま 3 本あり、対角化済み。ゆえに
    $$
    A^n=\mathrm{diag}(2^n,2^n,3^n).
    $$

(3) 相異なる $m-1$ 本の固有ベクトルが存在(ジョルダンブロック 2 が 1 つ)

  • 方針:一つの固有値の固有空間次元が 1 足りない状況(例:$3\times3$ で固有ベクトルは 2 本)。このとき $A$ は
    $$
    A=P\,\mathrm{diag}\big(J_2(\lambda),\ [\mu]\big)P^{-1}
    $$
    と相似($J_2(\lambda)=\begin{pmatrix}\lambda&1\\[2pt]0&\lambda\end{pmatrix}$)。
  • ブロックの冪:$J_2(\lambda)=\lambda I+N$($N^2=0$)より二項展開
    $$
    J_2(\lambda)^n=(\lambda I+N)^n=\lambda^n I+n\lambda^{n-1}N
    =\begin{pmatrix}\lambda^n&n\lambda^{n-1}\\[2pt]0&\lambda^n\end{pmatrix}.
    $$
  • 具体例($3\times3$)
    $$
    A=\begin{pmatrix}2&1&0\\[2pt]0&2&0\\[2pt]0&0&3\end{pmatrix}
    \sim \mathrm{diag}\big(J_2(2),[3]\big).
    $$
    よって
    $$
    A^n\sim \mathrm{diag}\left(
    \begin{pmatrix}2^n&n\,2^{\,n-1}\\[2pt]0&2^n\end{pmatrix},\ [\,3^n\,]
    \right).
    $$
    実際の $A^n$ は $P$ で挟み戻すことで得られる($P$ は一般化固有ベクトルから構成)。

(4) 相異なる $m-2$ 本の固有ベクトルが存在(ジョルダンブロック 3 など)

  • 方針:$3\times3$ で固有ベクトルが 1 本しかない場合を例に。$A$ は $J_3(\lambda)$ と相似。
  • ブロックの冪:$J_3(\lambda)=\lambda I+N$($N^3=0$)なので
    $$
    J_3(\lambda)^n=\sum_{r=0}^{2}\binom{n}{r}\lambda^{\,n-r}N^r
    =\begin{pmatrix}
    \lambda^n & \binom{n}{1}\lambda^{n-1} & \binom{n}{2}\lambda^{n-2}\\
    0&\lambda^n&\binom{n}{1}\lambda^{n-1}\\
    0&0&\lambda^n
    \end{pmatrix}.
    $$
  • 具体例
    $$
    A=\begin{pmatrix}2&1&0\\[2pt]0&2&1\\[2pt]0&0&2\end{pmatrix}=J_3(2).
    $$
    よって
    $$
    A^n=\begin{pmatrix}
    2^n & n\,2^{n-1} & \binom{n}{2}2^{n-2}\\[2pt]
    0 & 2^n & n\,2^{n-1}\\[2pt]
    0 & 0 & 2^n
    \end{pmatrix}.
    $$

(6) ジョルダン標準形の発想(一般化固有ベクトルの鎖)

  • 発想:固有ベクトルが足りないとき、$\lambda$ に対し
    $$
    (A-\lambda I)\mathbf{v}_1=\mathbf{0},\quad
    (A-\lambda I)\mathbf{v}_2=\mathbf{v}_1,\quad
    (A-\lambda I)\mathbf{v}_3=\mathbf{v}_2,\ \dots
    $$
    を満たす列 $\mathbf{v}_1,\mathbf{v}_2,\dots$ を作る(ジョルダン鎖)。この基底での行列表現が $J_k(\lambda)$。
    直感的には、$(A-\lambda I)$ は「1 つずつ手前のベクトルへ送る」作用で、上超対角の 1 がその働きを表す。鎖の長さがブロックの大きさを与える。

コメント