特征值求解方法

如果

L[u]=λuu=0

λ称为线性算子L的特征值,u为特征向量

特征值求解

Au=λudet(AλI)=0

如果A为Hermitian矩阵,则

A=UΣUHU=[u1...un]TΣ=diag(λ1...λ2)

特征值的基本概念

  • 称A的特征值入具有代数多重度(algebraic multiplicity) u,若λ是特征多项式
    det(A - zI)=0的u重根。
  • 若特征值λ的代数多重度为1,则称该特征值为单特征值(simple eigenvalue)。非
    单的特征值称为多重特征值(multiple eigenvalue)。
  • 称A的特征值入具有几何多重度(geometric multiplicity)~,若与入对应的线性
    无关特征向量的个数为γ。换言之,几何多重度,是特征空间Null(A -入I)的维数。
  • 矩阵A称为减次矩阵(derogatory matrix),若至少有一个特征值的几何多重度
    大于1。
  • 一特征值称为半单特征值(semi-simple eigenvalue),若它的代数多重度等于它的
    几何多重度。不是半单的特征值称为亏损特征值(defective eigenvalue)。

    特征多项式

    P(x)=det(AxI)=Pnxn...P1x+P0

特征方程

P(x)=0为特征方程

特征值性质

  • 矩阵A奇异,当且仅当至少有一个特征值λ=0。
  • 矩阵A和AT具有相同的特征值。
AλATλAHλAkλkA1λ1A+σ2Iλ+σ2
  • 共轭特征值和共轭特征向量成对出现
  • 对角矩阵和三角矩阵特征值为对角线元素值
  • 幂等矩阵A2=A特征值全部为0、1
  • 实正交矩阵特征值全部在单位圆上
  • 奇异矩阵至少一个特征值为0
  • 非奇异矩阵所有特征值非0
  • 特征值之和=迹i=1nλi=tr(A)
  • 一个Hermitian矩阵A是正定(或半正定)的,当且仅当它的特征值是正(或者
    非负)的。
  • 特征值之积等于行列式λ=det(A)=|A|
  • 特征值与秩的关系:

    • 若n×n矩阵A有r个非零特征值,则rank(A) ≥T。
    • 若0是n×n矩阵A的无多重的特征值,则rank(A)= n - 1。
    • 若rank(A -λI)≤n -1,则λ是矩阵A的特征值。
  • 若A的特征值不相同,则一定可以找到一个相似矩阵S1AS=D(对角矩阵),
    其对角元素即是矩阵A的特征值。

  • n xn矩阵A的任何一个特征值λ的几何多重度都不可能大于λ的代数多
    重度。
  • Caley-harmilton定理(AλiI)=0
  • 特征值和相似矩阵
    • λ是nxn矩阵A的一个特征值,并且nxn矩阵B非奇异,则入也是矩阵B-1AB的一个特征值,但对应的特征向量一般不相同。
    • λ是n×n矩阵A的一个特征值,并且n×n矩阵B是酉矩阵,则λ也是矩阵BHAB的一个特征值,但对应的特征向量一般不相同。
    • λ是nxn矩阵A的一个特征值,并且nxn矩阵B是正交矩阵,则λ也是
      矩阵BTAB的一个特征值,但对应的特征向量一般不相同。
  • 一个n xn矩阵A的最大特征值以该矩阵的列元素之和的最大值为界,λmax<maxj=1naij
  • 随机向量x(t)=[x1(t),x2(t),,xn(t)]T的相关矩阵R=Ex(t)xH(t)的特征值以最大和最小功率为界Pmin<=λ<=Pmax

    矩阵的谱

    矩阵所有特征值的集合

    谱半径

    ρ=max(λi)

    矩阵对角化

  • 定义: 一个n×n实矩阵A若与一个对角矩阵相似,则称矩阵A是可对角化
    的(diagonalizable)。

  • 定理:一个nxn实矩阵A是可对角化的,当且仅当A具有n个线性无关的
    特征向量。

    U1AU=ΣU=[u1...un]TΣ=diag(λ1...λ2)

Caley-harmlton定理及应用

P(x)=PnAn+...P1A+P0I=O

P(x)=Pnxn+...P1x+P0

是使A零化的多项式,则

P(A)=0

可以利用该定理求逆

左右同乘A的逆

A1=1P0(PnAn1+Pn1An2+...+P1I)
  • exampleA=[1546]det(AxI)=|1x546x|=(1x)(6x)5×4=x27x14A1=114(A7I)=114([1546]7[1001])=[3751427114]

矩阵指数函数的计算

eAt=I+At...1k!Aktk...

对于常见的一阶微分方程

x(t)=Ax(t)x(0)=x0

解为

x(t)=eAtx0

多阶矩阵微分方程

若A的特征多项式为

p(λ)=λn+cn1λn1...+c1λ+c0

对于矩阵微分方程

Y(n)(t)+cn1Y(n1)(t)...Y(t)=O

且满足初始条件

Y(0)=IY(0)=A...Y(n1)(t)=An1

Y(t)=eAt为矩阵方程唯一解

那么如何求解这个唯一解?

Y(t)=x1(t)I+x2(t)A+...xnAn1

其中xk(t)满足微分方程

x(n)(t)+cn1x(n1)(t)...c1x(t)+c0x(t)=0

且满足初始条件

xi(i1)=1

其他所有为0


特征分解的应用

给定一组彼此相关的随机变量,常常希望通过线性变换,把它变换成另外一组统计不相关的随机变量。甚至更进一步,希望变换后的一组统计不相关随机变量各个分量还具有单位方差。这两个任务可以通过标准正交变换和迷向圆变换分别完成。

标准正交变换

x 为m维随机向量,将x转化为0均值的随机向量,此时自相关矩阵和协方差矩阵相同,mx为其均值向量

x0=xmxRx0=Cx

其特征分解为

Cx=UxΣxUxH

w=UxHx0=UxH(xmx)mw=0Cw=Rw=UxHUxΣxUxHUx=Σx

该变化用于有色噪声白化

迷向圆变化

在上面的标准正交变换中,线性变换w=UxH(xmx)的自相关矩阵(与协方差矩阵相等)
Rx。为对角矩阵,但不是单位矩阵Ⅰ。要使u的自相关矩阵为单位矩阵,就需要对w再
作另一个线性变换

y=Σx1/2w=Σx1/2UxH(xmx)

Ry=Σx1/2ΣΣx1/2=I

离散K-L变换

在许多信号处理和模式识别应用中,常常需要将随机信号的观测样本用另外一组数(或系数)表示,同时使这种新的表示具有某些所希望的性质。例如,对于编码而言,希望信号可以用少数系数表示,同时这些系数集中了原信号的功率。又如,对于最优滤波,则希望变换后的样本统计不相关,这样就可以降低滤波器的复杂度,或者提高信噪比。实现上述目标的通用做法是将信号展开成正交基函数的线性组合,使得信号相对于基函数的各个分量不会相互干扰。

如果正交基函数根据信号观测样本的协方差矩阵适当选择,就有可能在所有正交基函数中,获得具有最小均方误差的信号表示。在均方误差最小的意义上,这样一种信号表示是最优的信号表示,它在随机信号的分析与编码中具有重要的意义和应用。这种信号变换是Karhunen和 Loeve 针对连续随机信号提出的,称为Kauhunen-Loeve变换。

对于M维向量

x=[x1,x2...xM]T

是一零均值向量

我们用小维度的w表示x,Q为一个酉矩阵

W=QHxx=QW=i=1Mqiwi

为了减小变换后的系数u;的个数,假定在上式中只使用w的前m个系数w1,,wm(m=1,M)逼近随机信号向量c,即

x^=i=1mqiwi,(1=<m<=M)

主分量分析

组分量分析的核心思想是吧,存在信息冗余的特征向量空间,通过正交变换进行降维,变成无信息冗余的向量空间

令Rx是数据向量x 的自相关矩阵,它有K个主特征值,与这些主特征值对应的K个特征向量称为数据向量x的主分量。

过程

  • 降维
  • 正交化
  • 功率最大化
x^=QHx=i=1pqixii=1kqixi(k<p)

广义特征分解

Au=λBudet(AλB)=0

Rayleigh商

Rayleigh商定义及其性质

Hermitian矩阵 ACn×n的 Rayleigh商或Rayleigh-Ritz 比 R(z)是一个标量,定义为

R(x)=xHAxxHx

瑞利商的目的是找到x让瑞利商最大或者最小,常在滤波中使用

假设信号如下,如果要对信号进行滤波,利用滤波器x,让滤波后信噪比最大

r(t)=BαS(t)+n(t)
  • 滤波器xH进行滤波后,SNR为|xHBαS(t)|2|xHn|2=xHAxxHnHnx()=xHAxσ2xHx

Rayleigh-Ritz定理

取x取最大最小特征值对应的特征向量时可以得到极值,极值为最大或最小特征值

Ax=λxmaxxHAxxHx=λmaxminxHAxxHx=λmin

广义瑞利商

当噪声不为白噪声时,噪声相关矩阵为B

R(x)=xHAxxHBx

应用变量代换

x^=B1/2xR(x^)=x^H(B1/2)HAB1/2x^x^Hx^

最大最小值为矩阵

(B1/2)HAB1/2

的最大或最小特征值

变量代换后求广义特征值

Ax=λBx