矩阵特征分析
特征值求解方法
如果
则
特征值求解
如果A为Hermitian矩阵,则
特征值的基本概念
- 称A的特征值入具有代数多重度(algebraic multiplicity) u,若
是特征多项式
det(A - zI)=0的u重根。 - 若特征值
的代数多重度为1,则称该特征值为单特征值(simple eigenvalue)。非
单的特征值称为多重特征值(multiple eigenvalue)。 - 称A的特征值入具有几何多重度(geometric multiplicity)~,若与入对应的线性
无关特征向量的个数为 。换言之,几何多重度,是特征空间Null(A -入I)的维数。 - 矩阵A称为减次矩阵(derogatory matrix),若至少有一个特征值的几何多重度
大于1。 - 一特征值称为半单特征值(semi-simple eigenvalue),若它的代数多重度等于它的
几何多重度。不是半单的特征值称为亏损特征值(defective eigenvalue)。特征多项式
特征方程
P(x)=0为特征方程
特征值性质
- 矩阵A奇异,当且仅当至少有一个特征值
=0。 - 矩阵A和
具有相同的特征值。
- 共轭特征值和共轭特征向量成对出现
- 对角矩阵和三角矩阵特征值为对角线元素值
- 幂等矩阵
特征值全部为0、1 - 实正交矩阵特征值全部在单位圆上
- 奇异矩阵至少一个特征值为0
- 非奇异矩阵所有特征值非0
- 特征值之和=迹
- 一个Hermitian矩阵A是正定(或半正定)的,当且仅当它的特征值是正(或者
非负)的。 - 特征值之积等于行列式
特征值与秩的关系:
- 若n×n矩阵A有r个非零特征值,则rank(A) ≥T。
- 若0是n×n矩阵A的无多重的特征值,则rank(A)= n - 1。
- 若rank(A -
I)≤n -1,则 是矩阵A的特征值。
若A的特征值不相同,则一定可以找到一个相似矩阵
(对角矩阵),
其对角元素即是矩阵A的特征值。- n xn矩阵A的任何一个特征值
的几何多重度都不可能大于 的代数多
重度。 - Caley-harmilton定理
- 特征值和相似矩阵
- 若
是nxn矩阵A的一个特征值,并且nxn矩阵B非奇异,则入也是矩阵B-1AB的一个特征值,但对应的特征向量一般不相同。 - 若
是n×n矩阵A的一个特征值,并且n×n矩阵B是酉矩阵,则 也是矩阵 的一个特征值,但对应的特征向量一般不相同。 - 若
是nxn矩阵A的一个特征值,并且nxn矩阵B是正交矩阵,则 也是
矩阵 的一个特征值,但对应的特征向量一般不相同。
- 若
- 一个n xn矩阵A的最大特征值以该矩阵的列元素之和的最大值为界,
- 随机向量
的相关矩阵 的特征值以最大和最小功率为界矩阵的谱
矩阵所有特征值的集合谱半径
矩阵对角化
定义: 一个n×n实矩阵A若与一个对角矩阵相似,则称矩阵A是可对角化
的(diagonalizable)。定理:一个nxn实矩阵A是可对角化的,当且仅当A具有n个线性无关的
特征向量。
Caley-harmlton定理及应用
若
则
是使A零化的多项式,则
可以利用该定理求逆
左右同乘A的逆
- example
矩阵指数函数的计算
对于常见的一阶微分方程
解为
多阶矩阵微分方程
若A的特征多项式为
对于矩阵微分方程
且满足初始条件
则
那么如何求解这个唯一解?
其中
且满足初始条件
其他所有为0
特征分解的应用
给定一组彼此相关的随机变量,常常希望通过线性变换,把它变换成另外一组统计不相关的随机变量。甚至更进一步,希望变换后的一组统计不相关随机变量各个分量还具有单位方差。这两个任务可以通过标准正交变换和迷向圆变换分别完成。
标准正交变换
x 为m维随机向量,将x转化为0均值的随机向量,此时自相关矩阵和协方差矩阵相同,
其特征分解为
令
该变化用于有色噪声白化
迷向圆变化
在上面的标准正交变换中,线性变换
作另一个线性变换
则
离散K-L变换
在许多信号处理和模式识别应用中,常常需要将随机信号的观测样本用另外一组数(或系数)表示,同时使这种新的表示具有某些所希望的性质。例如,对于编码而言,希望信号可以用少数系数表示,同时这些系数集中了原信号的功率。又如,对于最优滤波,则希望变换后的样本统计不相关,这样就可以降低滤波器的复杂度,或者提高信噪比。实现上述目标的通用做法是将信号展开成正交基函数的线性组合,使得信号相对于基函数的各个分量不会相互干扰。
如果正交基函数根据信号观测样本的协方差矩阵适当选择,就有可能在所有正交基函数中,获得具有最小均方误差的信号表示。在均方误差最小的意义上,这样一种信号表示是最优的信号表示,它在随机信号的分析与编码中具有重要的意义和应用。这种信号变换是Karhunen和 Loeve 针对连续随机信号提出的,称为Kauhunen-Loeve变换。
对于M维向量
是一零均值向量
我们用小维度的w表示x,
为了减小变换后的系数u;的个数,假定在上式中只使用w的前m个系数
主分量分析
组分量分析的核心思想是吧,存在信息冗余的特征向量空间,通过正交变换进行降维,变成无信息冗余的向量空间
令Rx是数据向量x 的自相关矩阵,它有K个主特征值,与这些主特征值对应的K个特征向量称为数据向量x的主分量。
过程
- 降维
- 正交化
- 功率最大化
广义特征分解
Rayleigh商
Rayleigh商定义及其性质
Hermitian矩阵
瑞利商的目的是找到x让瑞利商最大或者最小,常在滤波中使用
假设信号如下,如果要对信号进行滤波,利用滤波器x,让滤波后信噪比最大
- 滤波器
进行滤波后,SNR为
Rayleigh-Ritz定理
取x取最大最小特征值对应的特征向量时可以得到极值,极值为最大或最小特征值
广义瑞利商
当噪声不为白噪声时,噪声相关矩阵为B
应用变量代换
最大最小值为矩阵
的最大或最小特征值
变量代换后求广义特征值