矩阵特征分析
特征值求解方法
如果
则$\lambda$称为线性算子L的特征值,u为特征向量
特征值求解
如果A为Hermitian矩阵,则
特征值的基本概念
- 称A的特征值入具有代数多重度(algebraic multiplicity) u,若$\lambda$是特征多项式
det(A - zI)=0的u重根。 - 若特征值$\lambda$的代数多重度为1,则称该特征值为单特征值(simple eigenvalue)。非
单的特征值称为多重特征值(multiple eigenvalue)。 - 称A的特征值入具有几何多重度(geometric multiplicity)~,若与入对应的线性
无关特征向量的个数为$\gamma$。换言之,几何多重度,是特征空间Null(A -入I)的维数。 - 矩阵A称为减次矩阵(derogatory matrix),若至少有一个特征值的几何多重度
大于1。 - 一特征值称为半单特征值(semi-simple eigenvalue),若它的代数多重度等于它的
几何多重度。不是半单的特征值称为亏损特征值(defective eigenvalue)。特征多项式
特征方程
P(x)=0为特征方程
特征值性质
- 矩阵A奇异,当且仅当至少有一个特征值$\lambda$=0。
- 矩阵A和$A^T$具有相同的特征值。
- 共轭特征值和共轭特征向量成对出现
- 对角矩阵和三角矩阵特征值为对角线元素值
- 幂等矩阵$A^2=A$特征值全部为0、1
- 实正交矩阵特征值全部在单位圆上
- 奇异矩阵至少一个特征值为0
- 非奇异矩阵所有特征值非0
- 特征值之和=迹
- 一个Hermitian矩阵A是正定(或半正定)的,当且仅当它的特征值是正(或者
非负)的。 - 特征值之积等于行列式
特征值与秩的关系:
- 若n×n矩阵A有r个非零特征值,则rank(A) ≥T。
- 若0是n×n矩阵A的无多重的特征值,则rank(A)= n - 1。
- 若rank(A -$\lambda$I)≤n -1,则$\lambda$是矩阵A的特征值。
若A的特征值不相同,则一定可以找到一个相似矩阵$S^{-1}AS= D$(对角矩阵),
其对角元素即是矩阵A的特征值。- n xn矩阵A的任何一个特征值$\lambda$的几何多重度都不可能大于$\lambda$的代数多
重度。 - Caley-harmilton定理
- 特征值和相似矩阵
- 若$\lambda$是nxn矩阵A的一个特征值,并且nxn矩阵B非奇异,则入也是矩阵B-1AB的一个特征值,但对应的特征向量一般不相同。
- 若$\lambda$是n×n矩阵A的一个特征值,并且n×n矩阵B是酉矩阵,则$\lambda$也是矩阵$B^HAB$的一个特征值,但对应的特征向量一般不相同。
- 若$\lambda$是nxn矩阵A的一个特征值,并且nxn矩阵B是正交矩阵,则$\lambda$也是
矩阵$B^TAB$的一个特征值,但对应的特征向量一般不相同。
- 一个n xn矩阵A的最大特征值以该矩阵的列元素之和的最大值为界,
- 随机向量$x(t)= [x_1(t),x_2(t),… ,x_n(t)]^T$的相关矩阵$R=E{x(t)x^H(t)}$的特征值以最大和最小功率为界
矩阵的谱
矩阵所有特征值的集合谱半径
矩阵对角化
定义: 一个n×n实矩阵A若与一个对角矩阵相似,则称矩阵A是可对角化
的(diagonalizable)。定理:一个nxn实矩阵A是可对角化的,当且仅当A具有n个线性无关的
特征向量。
Caley-harmlton定理及应用
若
则
是使A零化的多项式,则
可以利用该定理求逆
左右同乘A的逆
- example
矩阵指数函数的计算
对于常见的一阶微分方程
解为
多阶矩阵微分方程
若A的特征多项式为
对于矩阵微分方程
且满足初始条件
则$Y(t)=e^{At}$为矩阵方程唯一解
那么如何求解这个唯一解?
其中$x_k(t)$满足微分方程
且满足初始条件
其他所有为0
特征分解的应用
给定一组彼此相关的随机变量,常常希望通过线性变换,把它变换成另外一组统计不相关的随机变量。甚至更进一步,希望变换后的一组统计不相关随机变量各个分量还具有单位方差。这两个任务可以通过标准正交变换和迷向圆变换分别完成。
标准正交变换
x 为m维随机向量,将x转化为0均值的随机向量,此时自相关矩阵和协方差矩阵相同,$m_x$为其均值向量
其特征分解为
令
该变化用于有色噪声白化
迷向圆变化
在上面的标准正交变换中,线性变换$w= U^H_x(x-m_x)$的自相关矩阵(与协方差矩阵相等)
$R_x$。为对角矩阵,但不是单位矩阵Ⅰ。要使u的自相关矩阵为单位矩阵,就需要对w再
作另一个线性变换
则
离散K-L变换
在许多信号处理和模式识别应用中,常常需要将随机信号的观测样本用另外一组数(或系数)表示,同时使这种新的表示具有某些所希望的性质。例如,对于编码而言,希望信号可以用少数系数表示,同时这些系数集中了原信号的功率。又如,对于最优滤波,则希望变换后的样本统计不相关,这样就可以降低滤波器的复杂度,或者提高信噪比。实现上述目标的通用做法是将信号展开成正交基函数的线性组合,使得信号相对于基函数的各个分量不会相互干扰。
如果正交基函数根据信号观测样本的协方差矩阵适当选择,就有可能在所有正交基函数中,获得具有最小均方误差的信号表示。在均方误差最小的意义上,这样一种信号表示是最优的信号表示,它在随机信号的分析与编码中具有重要的意义和应用。这种信号变换是Karhunen和 Loeve 针对连续随机信号提出的,称为Kauhunen-Loeve变换。
对于M维向量
是一零均值向量
我们用小维度的w表示x,$Q$为一个酉矩阵
为了减小变换后的系数u;的个数,假定在上式中只使用w的前m个系数$w_1,…, w_m(m = 1,… M)$逼近随机信号向量c,即
主分量分析
组分量分析的核心思想是吧,存在信息冗余的特征向量空间,通过正交变换进行降维,变成无信息冗余的向量空间
令Rx是数据向量x 的自相关矩阵,它有K个主特征值,与这些主特征值对应的K个特征向量称为数据向量x的主分量。
过程
- 降维
- 正交化
- 功率最大化
广义特征分解
Rayleigh商
Rayleigh商定义及其性质
Hermitian矩阵 $A\in C^{n\times n}$的 Rayleigh商或Rayleigh-Ritz 比 R(z)是一个标量,定义为
瑞利商的目的是找到x让瑞利商最大或者最小,常在滤波中使用
假设信号如下,如果要对信号进行滤波,利用滤波器x,让滤波后信噪比最大
- 滤波器$x^H$进行滤波后,SNR为
Rayleigh-Ritz定理
取x取最大最小特征值对应的特征向量时可以得到极值,极值为最大或最小特征值
广义瑞利商
当噪声不为白噪声时,噪声相关矩阵为B
应用变量代换
最大最小值为矩阵
的最大或最小特征值
变量代换后求广义特征值