Skip to main content

矩阵分析复习笔记

· 18 min read
Ferdinand Su
PhD Student @ HIT-ICES, Founder & Manager @ HIT-ReFreSH, C# developer.

大楚兴,陈胜王

线性代数概要与提高

基础定义

  1. 线性方程组
  2. 二次型f(x)=XTAXf(x)=X^TAX
  3. 相似对角化PFn×n,P1AP=diag(λ1,,λn)\exist P\in \mathbb{F}^{n\times n},P^{-1}AP=diag(\lambda_1,\cdots,\lambda_n)

分块矩阵☀️

  • 分块矩阵乘法法则:如果把每个分块视为数的乘法和每个分块见的乘法均成立,则分块矩阵乘法成立。
  • 准三角矩阵和的对角线上如果都是方阵,则整个矩阵也是方阵,行列式是对角线上各个子阵的乘积
  • 分块矩阵的转置等于各个分块转置后再分别转置的结果。

矩阵乘法例题⭐️

P1,P2Cn×n,P12=P1,P22=P2P_1,P_2\in \mathbb C^{n\times n},P_1^2=P_1,P_2^2=P_2

求证:(P1+P2)2=P1+P2    P1P2=P2P1=0(P_1+P_2)^2=P_1+P_2\iff P_1P_2=P_2P_1=0

证明:

\lArr

显然

\rArr

(P1+P2)2=P1+P2P1P2+P2P1=0P1P2=P2P1P1P2=P1(P2P2)=(P1P2)P2=P2(P1P2)=P2P1P1P2=P2P1=0(P_1+P_2)^2=P_1+P_2\\ \rArr P_1P_2+P_2P_1=0\\ \rArr P_1P_2=-P_2P_1\\ \rArr P_1P_2=P_1(P_2P_2)=(P_1P_2)P_2=\\-P_2(P_1P_2)=P_2P_1\\ \rArr P_1P_2=P_2P_1=0

右线性空间

如果以下条件皆成立:

  1. +满足结合律
  2. +满足交换律
  3. 数乘对+满足分配律(2种)
  4. 数乘对\cdot满足结合律
  5. 零元可由0的数乘获得
  6. 1α=α1\cdot \alpha=\alpha
  7. 数乘时数在右边

则称(V,+,)(V,+,\cdot)构成一个右线性空间

其它空间

  1. 数列空间FN={定义在N上,在F上取值的数列全体}\mathbb{F}^\mathbb{N}=\{定义在\mathbb{N}上,在\mathbb{F}上取值的数列全体\}
  2. 多项式空间F[X]={系数在F的多项式全体}\mathbb{F}[X]=\{系数在\mathbb{F}的多项式全体\}

基底与坐标

若V为F\mathbb{F}上的右线性空间,若存在正整数nnε1,,εnV\varepsilon_1,\cdots,\varepsilon_n\in V使得αV,k1knF,εiki=α\forall\alpha\in V,\exists k_1\cdots k_n\in \mathbb{F},\sum\varepsilon_ik_i=\alpha则称ε1,,εn\varepsilon_1,\cdots,\varepsilon_n是一组基底,(k1,,kn)T(k_1,\cdots, k_n)^T为该基底下的坐标

基底变换

E1,E2E_1,E_2均为V的基底,如果E2=E1PE_2=E_1P, 称P为E1E_1E2E_2的过渡矩阵

α=(ε1εn)(x1xn)=(ε1εn)(x1xn)=(ε1εn)P(x1xn)\alpha= \begin{pmatrix} \varepsilon_1& \cdots& \varepsilon_n\\ \end{pmatrix} \begin{pmatrix} x_1\\ \vdots\\ x_n \end{pmatrix} =\begin{pmatrix} \varepsilon_1'& \cdots& \varepsilon_n'\\ \end{pmatrix} \begin{pmatrix} x_1'\\ \vdots\\ x_n' \end{pmatrix} =\begin{pmatrix} \varepsilon_1& \cdots& \varepsilon_n\\ \end{pmatrix} P \begin{pmatrix} x_1'\\ \vdots\\ x_n' \end{pmatrix}

线性子空间

如果V的子集W对假发和数乘封闭,则称W为V的一个线性子空间,记作WVW\le V

  • 最小的子空间{0}\{0\},最大子空间V
  • 0维只有一个子空间,1维两个,2维及以上子空间相当于超平面,有无数个
生成子空间

S{α1,,αr}VS\{\alpha_1,\cdots,\alpha_r\}\le VSpm(S)=<S>={α1λ1,,αrλr}Spm(S)=\lt S\gt =\{\alpha_1\lambda_1,\cdots,\alpha_r\lambda_r\}是V中包含S的最小线性子空间,称为S生成的子空间。

交与和
  • V1+V2={α+βα,βV1V2}V_1+V_2=\{\alpha+\beta|\alpha,\beta\in V_1\cup V_2\}
  • dim(V1+V2)+dim(V1V2)=dim(V1)+dim(V2)dim(V_1+V_2)+dim(V_1\cap V_2)=dim(V_1)+dim(V_2)
  • 直和分解:如果VV中任意元素可以唯一写为β1+β2\beta_1+\beta_2的形式,其中β1W1,β2W2\beta_1\in W_1,\beta_2\in W_2则称W1+W2=VW_1+W_2=V为一个直和分解
  • 如果V1V2VV_1\le V_2\le V,则dim(V1)dim(V2)dim(V)dim(V_1)\le dim(V_2)\le dim(V)后者等号成立当且仅当前者等号成立

内积空间

设V是F\mathbb F上的右线性空间,如果映射<,>:V×VF\lt,\gt:V\times V\rarr \mathbb F满足

  1. <β,α>=<α,β>\lt \beta ,\alpha \gt=\overline{\lt \alpha,\beta\gt}
  2. <α,α>0\lt\alpha,\alpha\gt\ge 0且等号成立当且仅当α=θv\alpha = \theta_v
  3. 关于第二个分量线性

则称<,>\lt,\gtVV上的F\mathbb F内积,(V,<,>)(V,\lt,\gt)构成一个F\mathbb{F}-内积空间,又称欧几里得空间或酉空间。

操作符<,>\lt,\gt仅在陈氏矩阵分析中使用,与一般的(,)(,)等效,其效果是增加了使用latex描述陈氏矩阵分析的复杂性。θv\theta_v表示零元,似乎也仅见于陈氏矩阵分析。

另外,关于第一个分量有:

<α1λ1+α2λ2,β>=<α1,β>λ1+<α2,β>λ2\lt\alpha_1\lambda_1+\alpha_2\lambda_2,\beta\gt=\lt\alpha_1,\beta\gt\overline{\lambda_1}+\lt\alpha_2,\beta\gt\overline{\lambda_2}

勾股定理

<α,β>=0αβ\lt\alpha,\beta\gt=0\lrArr \alpha\bot\beta
  • 此时如果令γ=α+β\gamma=\alpha+\beta<γ,γ>=<α,α>+<β,β>\lt\gamma,\gamma\gt=\lt\alpha,\alpha\gt+\lt\beta,\beta\gt
  • 定义α=<α,α>||\alpha||=\sqrt{\lt\alpha,\alpha\gt}α\alpha<,>\lt,\gt下的长度
  • 定义d(α,β)=αβd(\alpha,\beta)=||\alpha-\beta||为距离

柯西不等式

βα<α,β>||\beta||||\alpha||\ge|\lt\alpha,\beta\gt|

度量矩阵与标准正交基

称基底E[]=ε1,,εn\Epsilon[]=\varepsilon_1,\cdots,\varepsilon_n对应的矩阵

Mn×n=(<ε1,ε1><ε1,εn><εn,ε1><εn,εn>)M_{n\times n}= \begin{pmatrix} \lt\varepsilon_1,\varepsilon_1\gt&\cdots&\lt\varepsilon_1,\varepsilon_n\gt\\ \vdots&\ddots&\vdots\\ \lt\varepsilon_n,\varepsilon_1\gt&\cdots&\lt\varepsilon_n,\varepsilon_n\gt\\ \end{pmatrix}

为度量矩阵。

M=IM=I时,称E[]\Epsilon[]为一组单位正交基

内积的证明例题⭐️

V=Fn×n,<,>:V×VF,(A,B)tr(AHB)V=\mathbb F^{n\times n},\lt\cdot,\cdot\gt:V\times V\rarr F,(A,B)\mapsto tr(A^HB),求证<,>\lt\cdot,\cdot\gt是内积

解:

<A,B>=<B,A>\lt A,B\gt=\overline{\lt B,A\gt}

<A,B>=tr(AHB)=tr((AHB)T)=tr(BHA)=tr(BHA)=<B,A>\lt A,B\gt=tr(A^HB)=tr((A^HB)^T)=\\ tr(\overline{ B^HA})=\overline{ tr(B^HA)}=\overline{\lt B,A\gt}

<A,A>0\lt A,A\gt\ge 0且等号成立当且仅当α=θv\alpha = \theta_v

A={ak,j+bk,ji}n×n,a,bRA=\{a_{k,j}+b_{k,j}i\}_{n\times n},a,b\in\mathbb{ R},i虚数单位,则

<A,A>=tr(AHA)=x=1ny=1n(ax,y2+bx,y2)0\lt A,A\gt=tr(A^HA)=\sum_{x=1}^n\sum_{y=1}^n (a_{x,y}^2+b_{x,y}^2)\ge 0

取等号当且仅当ax,y=bx,y=0a_{x,y}=b_{x,y}=0,即A=θVA=\theta_V

关于第二个分量线性:

<A,B>+<A,C>=tr(AHB)+tr(AHC)=tr(AHB+AHC)=tr(AH(B+C))=<A,(B+C)>\lt A,B\gt+\lt A,C\gt=tr(A^HB)+tr(A^HC)=tr(A^HB+A^HC)=\\ tr(A^H(B+C))=\lt A,(B+C)\gt <A,B>λ=tr(AHB)λ=tr(AHBλ)=<A,Bλ>\lt A,B\gt\lambda=tr(A^HB)\cdot\lambda=tr(A^HB\cdot\lambda)=\lt A,B\lambda\gt

线性映射⭐️

  • 如果映射是线性的,就叫线性映射
  • 线性自映射又叫线性算子
  • 零元对齐

线性映射例题⭐️

V={e2x(bx+c)b,cC},A:VV,f(x)f(x)V=\{e^{2x}(bx+c)|b,c\in\mathbb C\},A:V\rarr V,f(x)\mapsto f'(x),求其矩阵表示及Jordan标准型

解:

考虑到e2x(bx+c)=bxe2x+ce2xe^{2x}(bx+c)=bxe^{2x}+ce^{2x},(e2x(bx+c))=2bxe2x+(2c+b)e2x(e^{2x}(bx+c))'=2bxe^{2x}+(2c+b)e^{2x},取基底ξ1=xe2x,ξ2=e2x\xi_1=xe^{2x},\xi_2=e^{2x},则该基底下坐标f(x)=(b,c)T,f(x)=(2b,2c+b)Tf(x)=(b,c)^T,f'(x)=(2b,2c+b)^T,从而

A=(2012)A=\begin{pmatrix} 2&0\\ 1&2 \end{pmatrix}

其特征多项式IxA=(x2)2|Ix-A|=(x-2)^2,求得特征值λ=2\lambda=2,代数重数2,几何重数1,故A的Jordan标准型为J2(2)J_2(2)

像空间和核空间

  • Im(f)={f(α)αV1}V2Im(f)=\{f(\alpha)|\alpha\in V_1\}\le V_2
  • Ker(f)={αV1f(α)=θV2V1Ker(f)=\{\alpha\in V_1|f(\alpha)=\theta_{V_2}\le V_1
  • Ker(f)={θV1}Ker(f)=\{\theta_{V_1}\}当且仅当ff为单射
  • 线性双射又称线性同构,此时称两个线性空间同构,记作V1φV2V_1\underset{\varphi}{\cong}V_2

矩阵表示

  • 有限维的线性空间间的线性映射可用矩阵表示。取V1V_1的基底α1,,αn\alpha_1,\cdots,\alpha_nV2V_2的基底β1,,βm\beta_1,\cdots,\beta_m,则对于映射φ:V1V2\varphi:V_1\rarr V_2αV1\alpha\in V_1,如果φ(α)=(β1,,βm)AX\varphi(\alpha)=(\beta_1,\cdots,\beta_m)AX则称A是φ\varphi在这两组基下的矩阵表示
  • 换底时,对于AP=A,BQ=B\Alpha P=\Alpha',\Beta Q=\Beta ',对应的AAA=Q1APA'=Q^{-1}AP,此时称A‘和A是相抵的,记作AAA\sim A'
  • \sim是一个等价关系,相抵的矩阵有相等的秩
  • 特别地,当φ\varphi 是线性算子,且P=QP=QA=P1APA'=P^{-1}AP,称AA'AA相似

子空间的正交补

设内积空间VV,有子空间WVW\le V

W={βV<α,β>=0,αW}W^\bot=\{\beta \in V|\lt\alpha,\beta\gt=0,\forall \alpha \in W\}

称为W的正交补

显然WVW^\bot\le V,WW={θV}W\cap W^\bot=\{\theta_V\}

正交补的和

证明:W+W=VW+W^\bot=V

r=dim(W)r=dim(W)

  1. r=0r=0,W={θv},W=VW=\{\theta_v\},W^\bot =V,显然
  2. r=n,W=V,W={θv}r=n,W=V,W^\bot=\{\theta_v\},显然
  3. 如果0<r<n0\lt r\lt n,可以取WW的一组标准正交基ε1,,εr\varepsilon_1,\cdots,\varepsilon_r,那么显然VV存在一组标准正交基ε1,,εr,εr+1,,εn\varepsilon_1,\cdots,\varepsilon_r,\varepsilon_{r+1},\cdots,\varepsilon_n;考虑到εr+1,,εnW\varepsilon_{r+1},\cdots,\varepsilon_n\in W^\bot,显然有nr=dim([εr+1,,εn])dim(W)n-r=dim([\varepsilon_{r+1},\cdots,\varepsilon_n])\le dim(W);从而n=r+nrdim(W)+dim(W)=dim(W+W)dim(V)=ndim(W+W)=nW+W=Vn=r+n-r\le dim(W)+dim(W^\bot)=dim(W+W^\bot)\le dim(V)=n\rArr dim(W+W^\bot)=n\rArr W+W^\bot=V

保内积的线性算子

  • 如果算子σ\sigma满足<σ(α),σ(β)>=<α,β>\lt\sigma(\alpha),\sigma(\beta)\gt=\lt\alpha,\beta\gt,则称σ\sigma保内积
  • 保内积的线性算子在实数域被称为正交变换,在复数域被称为酉变换

相似与相抵

  • 相抵:B=Q1APB=Q^{-1}AP
  • 相似:B=P1APB=P^{-1}AP
  • 如果PTP=I,PRn×nP^TP=I,P\in\mathbb{R}^{n\times n},称之为正交阵
  • 如果PHP=I,PCn×nP^HP=I,P\in\mathbb{C}^{n\times n},称之为酉矩阵

相似不变量

  1. 相似是等价关系
  2. AB{det(A)=det(B)tr(A)=tr(B)rank(A)=rank(B)f(A)=f(B),f(X)C[X]f(A)=0f(B)=0A\sim B\rArr\begin{cases} det(A)=det(B)\\ tr(A)=tr(B)\\ rank(A)=rank(B)\\ f(A)=f(B),f(X)\in \mathbb{C}[X]\\ f(A)=0\lrarr f(B)=0 \end{cases}
  3. 最小多项式mA(x)m_A(x)是满足mA(A)=0m_A(A)=0的次数最小的、首系数为1的多项式

相似标准型

  • 称针对矩阵AA的行为P1AP=D=diag(λ1,,λn)P^{-1}AP=D=diag(\lambda_1,\cdots,\lambda_n)为相似对角化,其中P=(ξ1,,ξn)P=(\xi_1,\cdots,\xi_n)

Schur标准型

  • ACn×n,U,UHU=I,U1AU=B\forall A\in \mathbb{C}^{n\times n},\exists U,U^HU=I,U^{-1}AU=B,使得BB是上三角矩阵。可以使用数学归纳法证明。
  • 引理:存在可逆矩阵PP使得P1BP=diag(b1,,bn)P^{-1}BP=diag(b_1,\cdots,b_n)

酉相似对角化

ACn×nA\in \mathbb{C}^{n\times n},则以下条件等价:

  1. U,UHU=I,U1AU=D=diag(λ1,,λn)Cn×n\exist U,U^HU=I,U^{-1}AU=D=diag(\lambda_1,\cdots,\lambda_n)\in \mathbb{C}^{n\times n}
  2. AHA=AAHA^HA=AA^H
  3. A是正规的

Jordan标准型

ACn×n,P,P\forall A\in\mathbb{C}^{n\times n}, \exist P,P可逆使得P1AP=P^{-1}AP=

J=(J1Jn)J=\begin{pmatrix} J_1&&\\ &\ddots&\\ &&J_n \end{pmatrix}

其中Ji={(λi)(λi1λi1λi1λi)J_i=\begin{cases} \begin{pmatrix} \lambda_i \end{pmatrix}\\ \begin{pmatrix} \lambda_i& 1&&&&\\ & \lambda_i& 1&&&\\ &&\ddots&\ddots&&\\ &&&\lambda_i&1\\ &&&&\lambda_i \end{pmatrix} \end{cases}

JJAA的Jordan标准型。

PP一般不唯一,但JJ本质上唯一。

Jordan标准型的最小多项式等于各Jordan块最小多项式的最小公倍式

计算Jordan标准型(和PP)的方法:

  • 通过矩阵变换求解
  • 计算方法
    • 几何重数:某一特征值对应特征方程的解向量的个数,是某一特征值对应Jordan块的个数
    • 代数重数:矩阵对应的特征方程有特征值,相同的特征值的个数,是某一特征值对应Jordan块的阶数之和
    • 破防了,具体求法要不咱们ignore吧

      1. 求特征值和代数重数
      2. 对于每个特征值λi\lambda_i和重数kk
        1. 求几何重数,即对应于它的根子空间维数dim Ker(AIλ)=nr(AIλ)dim\space Ker(A-I\lambda)=n-r(A-I\lambda)
        2. 求使得r((AIλ)k)=0r((A-I\lambda)^k)= 0的最小整数kk,它等于最大的Jordan块阶数
        3. 正常题到这里就结束了,如果没结束那建议放弃
      3. P=(α1,α2,,αn)P=(\alpha_1,\alpha_2,\cdots,\alpha_n),解决方程组AP=PJAP=PJ即可求得PP
广义特征向量

ACn×n,λC,kZ+,ξCn×1A\in \mathbb{C}^{n\times n},\lambda\in\mathbb{C},k\in\mathbb{Z}_+,\xi\in \mathbb{C}^{n\times 1},如果

  1. (AλI)kξ=0(A-\lambda I)^k\xi=0
  2. (AλI)k1ξ0(A-\lambda I)^{k-1}\xi\not=0

则称ξ\xi是属于AA的特征值λ\lambda,深度为kk的广义特征向量

酉相抵标准型

0ACm×n0\not ={A}\in\mathbb{C}^{m\times n},显然V,=(V1,V2)VHV=I,V1(AHA)V=diag(λ1,,λr,0,,0)=diag(δ12,,δr2,0,,0)\exist V,=(V_1,V_2)V^HV=I,V^{-1}(A^HA)V=diag(\lambda_1,\cdots,\lambda_r,0,\cdots,0)\\=diag(\delta_1^2,\cdots,\delta_r^2,0,\cdots,0)

  • 显然λ1,,λr\lambda_1,\cdots,\lambda_r是一组非负实数

    • V1(AHA)VV^{-1}(A^HA)V
  • δ1,,δr \delta_1,\cdots,\delta_r称为AA的奇异值,规定δ1δ2δn\delta_1\ge\delta_2\ge\cdots\ge\delta_n

  • Σ=diag(δ1,,δn)\Sigma=diag(\delta_1,\cdots,\delta_n)V1AHAV=(Σ2000)V^{-1}A^HAV=\begin{pmatrix}\Sigma^2&0\\0&0\end{pmatrix}

  • U1=AV1Σ1U_1=AV_1\Sigma^{-1},则U1HU1=IrU_1^HU_1=I_r,其列向量组是标准正交的,因此U2,U=(U1,U2),UHU=I\exist U_2,U=(U_1,U_2),U^HU=I,从而U1AV=(Σ000)U^{-1}AV=\begin{pmatrix}\Sigma&0\\0&0\end{pmatrix}

例题

1. 求Jordan标准型,可逆阵P,最小多项式

已知

A=(1234123121)A=\begin{pmatrix} 1&2&3&4\\ &1&2&3\\ &&1&2\\ &&&1 \end{pmatrix}
  1. 求Jordan标准型JJ
  2. 求可逆方阵P,J=P1APJ=P^{-1}AP
  3. AA的最小多项式

解:

1.显然AA的特征多项式φA(λ)=(λ1)4\varphi_A(\lambda)=(\lambda-1)^4. 由于

rank(AI)=3dim Ker(AI)=4rank(AI)=1rank(A-I)=3\\ dim\space Ker(A-I)=4-rank(A-I)=1

因此只有一个属于特征值1的Jordan块

J=J4(1)J=J_4(1)

2.计算得

(AI)2=(00412004000),(AI)3=(0008000000)(A-I)^2=\begin{pmatrix} 0&0&4&12\\ &0&0&4\\ &&0&0\\ &&&0 \end{pmatrix}, (A-I)^3=\begin{pmatrix} 0&0&0&8\\ &0&0&0\\ &&0&0\\ &&&0 \end{pmatrix}

显然X4=(0,0,0,1)TX_4=(0,0,0,1)^T满足(AI)3X40(A-I)^3X_4\not ={0},X4X_4是4次根向量 从而X3=(AI)X4=(4,3,2,0)T,X2=(AI)X3=(12,4,0,0)T,X1=(AI)X2=(8,0,0,0)TX_3=(A-I)X_4=(4,3,2,0)^T,X_2=(A-I)X_3=(12,4,0,0)^T,X_1=(A-I)X_2=(8,0,0,0)^TP=(X1,X2,X3,X4),P1AP=JP=(X_1,X_2,X_3,X_4),P^{-1}AP=J 3.mA(λ)=mJ(λ)=(λ1)4m_A(\lambda)=m_J(\lambda)=(\lambda-1)^4

2.求差分方程解空间的一个基

差分方程yk+32yk+25yk+1+6yk=0y_{k+3}-2y_{k+2}-5y_{k+1}+6y_k=0

解:

考虑线性算子AAAyn=yn+1Ay_n=y_{n+1},令p(x)=x32x25x+6p(x)=x^3-2x^2-5x+6,则目标解空间为

W={y:NCp(A)y=0}=ker(P(A))CNW=\{y:\mathbb{N}\rarr\mathbb{C}|p(A)y=0\}=ker(P(A))\le \mathbb{C}^\mathbb{N}

φ:C3×1W\varphi:\mathbb{C}^{3\times 1}\rarr W, (a,b,c)T(a,b,c,)T)(a,b,c)^T\mapsto (a,b,c,\cdots)^T),显然φ\varphi是线性双射,故WW是三维线性空间,有基底φ((1,0,0)T),φ((0,1,0)T),φ((0,0,1)T)\varphi((1,0,0)^T),\varphi((0,1,0)^T),\varphi((0,0,1)^T)

3.求矩阵对角线映射核空间的一组基

f:R2×2R,Atr(A)f:\mathbb{R}^{2\times 2}\rarr\mathbb{R},A \mapsto tr(A)

  1. kerf\ker f的一组基
  2. R\mathbb{R}上定义<,>:R×RR,<A,B>tr(ATB)\lt,\gt:\mathbb{R}\times \mathbb{R}\rarr \mathbb{R},\lt A,B\gt\mapsto tr(A^TB),证明<,>\lt,\gt是内积,并求kerf\ker f^\bot

解:

  1. 显然:
α1=(1001),α2=(0100),α3=(0010)\alpha_1=\begin{pmatrix} 1&0\\ 0&-1 \end{pmatrix}, \alpha_2=\begin{pmatrix} 0&1\\ 0&0 \end{pmatrix}, \alpha_3=\begin{pmatrix} 0&0\\ 1&0 \end{pmatrix}

是一组基

  1. <A,B>=tr(ATB)=<B,A>,<A,A>=a112+a122+a212+a2220\lt A,B\gt=tr(A^TB)=\lt B,A\gt,\lt A,A\gt=a_{11}^2+a_{12}^2+a_{21}^2+a_{22}^2\ge 0,线性显然

从而kerf={βtr(α1Tβ)=tr(α2Tβ)=tr(α3Tβ)=0}\ker f^\bot=\{\beta|tr(\alpha_1^T\beta )=tr(\alpha_2^T\beta )=tr(\alpha_3^T\beta )=0\}

矩阵范数与分析

知识储备

  1. 数列和函数的极限,导数,微分,积分,无穷级数
  2. 柯西收敛准则ε>0,NN,m1,m2>N\forall \varepsilon\gt 0,\exist N\in \mathbb{N},m_1,m_2\gt N时有am1am2<ε|a_{m_1}-a_{m_2}|\lt\varepsilon

范数

VVF\mathbb{F}上的有限维线性空间,如果映射:VR:V\rarr \mathbb{R}满足

  1. αV,α0\forall \alpha\in V,||\alpha||\ge 0,等号成立当且仅当α=θV\alpha=\theta_V
  2. αV,λF,αλ=αλ\forall \alpha\in V,\lambda\in\mathbb F,||\alpha\lambda||=||\alpha||\cdot||\lambda||
  3. α,βV,α+βα+β\forall \alpha,\beta\in V,||\alpha+\beta||\le||\alpha||+||\beta||

则称X||X||VV上的范数,称VV为赋范线性空间

定义VV上元素的距离为他们差的范数。

  • X1,X2||X||_1,||X||_2是两个范数,则存在正常数c1,c2,υV,υ1c1υ2;υ2c2υ1c_1,c_2,\forall \upsilon\in V,||\upsilon||_1\le c_1||\upsilon||_2;||\upsilon||_2\le c_2||\upsilon||_1
  • {υn}nN\{\upsilon_n\}_{n\in \mathbb{N}}是否柯西收敛与范数选取无关
  • 有限维赋范线性空间上的柯西列必定收敛

P-范数

αp=(x1,,xn)Tp=(i=1nxip)1p||\alpha||_p=||(x_1,\cdots,x_n)^T||_p=(\sum_{i=1}^n|x_i|^p)^{\frac{1}{p}}
  • p=,α=max{xi}p=\infin,||\alpha||_\infin=max\{|x_i|\}

线性映射的范数

f:(V1,X1)(V2,X2)f:(V_1,||X||_1)\rarr (V_2,||X||_2),则

f=maxv0V1{θv1}f(v0)2v01=maxv0{v v1=1}}f(v0)2||f||=\underset{v_0\in V_1-\{\theta_{v_1}\}}{\max}\frac{||f(v_0)||_2}{||v_0||_1}=\underset{v_0\in \{v|\space||v||_1=1\}\}}{\max}||f(v_0)||_2

矩阵的范数

设矩阵AFm×n,φ:Fn×1Fm×1,XAXA\in\mathbb{F}^{m\times n},\varphi:\mathbb F^{n\times 1}\rarr\mathbb F^{m\times 1},X\mapsto AX,则A=φ||A||=||\varphi||

P-计算公式

  • p=1,A=max1jni=1maijp=1,||A||=\underset{1\le j\le n}{max}\sum_{i=1}^m|a_{ij}|(列和范数)
  • p=2,A=δ1p=2,||A||=\delta_1(最大奇异值)
  • p=,A=max1imj=1naijp=\infin,||A||=\underset{1\le i\le m}{max}\sum_{j=1}^n|a_{ij}|(行和范数)

一些性质:

ABAB(0)||A\cdot B||\le||A||\cdot||B||\tag{0}
  • 对于方阵,A2A2||A^2||\le||A||^2
  • 对于方阵,当A<1,limkAk=0||A||\lt 1,\underset{k\rarr\infin}{lim}A^k=0
  • 对于满足(0)这样的范数,X||X||存在且AXAX||AX||\le||A||\cdot||X||;Aρ(A)=max1inλi||A||\ge \rho(A)=\underset{1\le i\le n}{max}|\lambda_i|
  • A0Cn×n,ε>0,Cn×n\forall A\not=0\in \mathbb C^{n\times n},\forall \varepsilon\gt 0,\exists \mathbb C^{n\times n}上满足(0)的范数,使得Aρ(A)+ε||A||\le\rho(A)+\varepsilon
  • 如果ρ(A)<1\rho(A)\lt 1,则存在范数使得A<1||A||\lt 1

方阵的序列及级数收敛性

序列收敛性

极限limkAk\underset{k\rarr\infin}{lim}A^k存在的充要条件是:

  1. ρ(A)1\rho(A)\le 1
  2. 所有模长为1的特征值只能是1,切特征值为1 的每个Jordan块大小均为1×11\times 1

如果limkAk=P,P2=P\underset{k\rarr\infin}{lim}A^k=P,P^2=P

级数收敛性

无穷级数k=0+Ak\sum_{k=0}^{+\infin}A^k收敛的充要条件是ρ(A)<1\rho(A)\lt 1

此时k=0+Ak=(IA)1\sum_{k=0}^{+\infin}A^k=(I-A)^{-1}

矩阵函数与收敛半径

如果f(z)=m=0+amzmf(z)=\sum_{m=0}^{+\infin}a_mz^m的收敛半径r>0r\gt 0,且方阵AA的谱半径严格小于rr,则f(z)z=A=f(A)=m=0+amzmf(z)|_{z=A}=f(A)=\sum_{m=0}^{+\infin}a_mz^m有意义。

计算f(A)f(A)可以采用以下方法:

f(A)=Pf(J)P1=Pdiag(f(J1),,f(Jn))P1=Pdiag(f(λ1I+N),)P1f(A)=Pf(J)P^{-1}=\\ Pdiag(f(J_1),\cdots,f(J_n))P^{-1}=\\ Pdiag(f(\lambda_1 I+N),\cdots)P^{-1}

其中N=(01010),Nk=0,k2N=\begin{pmatrix}0&1&\cdots&0\\&\ddots&\ddots&\vdots\\&&\ddots&1\\&&&0\end{pmatrix},N^k=0,k\ge 2

从而对于J3(λ)J_3(\lambda)

f(J3(λ))=(αβγ0αβ00α),{α=m=0+amλm=f(0)(λ)/0!β=m=0+amλm1Cm1=f(1)(λ)/1!γ=m=0+amλm2Cm2=f(2)(λ)/2!f(J_3(\lambda))= \begin{pmatrix} \alpha&\beta&\gamma\\ 0&\alpha&\beta\\ 0&0&\alpha \end{pmatrix},\\ \begin{cases} \alpha=\sum_{m=0}^{+\infin}a_m\lambda^m=f^{(0)}(\lambda)/0!\\ \beta=\sum_{m=0}^{+\infin}a_m\lambda^{m-1}C_m^1=f^{(1)}(\lambda)/1!\\ \gamma=\sum_{m=0}^{+\infin}a_m\lambda^{m-2}C_m^2=f^{(2)}(\lambda)/2!\\ \end{cases}

常用函数

函数展开收敛半径
eze^zi=0+zii!\sum_{i=0}^{+\infin}\frac{z^i}{i!}++\infin
cosz\cos zi=0+(1)iz2i(2i)!\sum_{i=0}^{+\infin}\frac{(-1)^iz^{2i}}{(2i)!}++\infin
sinz\sin zi=0+(1)iz2i+1(2i+1)!\sum_{i=0}^{+\infin}\frac{(-1)^iz^{2i+1}}{(2i+1)!}++\infin
(1z)1(1-z)^{-1}i=0+zi\sum_{i=0}^{+\infin}{z^i}1
ln(1+z)\ln (1+z)i=0+(1)izi+1(i+1)!\sum_{i=0}^{+\infin}\frac{(-1)^iz^{i+1}}{(i+1)!}1
(1+z)α,αR(1+z)^\alpha,\alpha\in\mathbb Ri=0+Cαizi\sum_{i=0}^{+\infin}C_\alpha^iz^i1

eAe^A的特性

以下特性可通过定义证明:

  1. 如果AB=BAAB=BAeAeB=eA+B=eBeAe^Ae^B=e^{A+B}=e^Be^A
  2. (eA)1=eA(e^A)^{-1}=e^{-A}
  3. det(eA)=etr(A)det(e^A)=e^{tr(A)}
  4. eiA=cosA+isinA(i2=1)e^{iA}=\cos A+i\sin A(i^2=-1)
  5. 如果AA是实反对称矩阵(A+AT=0A+A^T=0),eAe^A是行列式为1的实正交阵
  6. 如果AH=AA^H=A,则eiAe^{iA}是酉矩阵

导数

方阵对某个变量的导数,等于其内各项分别求导得到的新方阵。

矩阵函数的插值计算

如果xIAn×n=i=1S(xλi)αi,λi|xI-A_{n\times n}|=\prod_{i=1}^S(x-\lambda_i)^{\alpha_i},\lambda_i互不重复,且f(z)=m=0+amzmf(z)=\sum_{m=0}^{+\infin}a_mz^m的收敛半径r>ρ(A)r\gt \rho(A)

g(z)=c0+c1z++cn1zn1\exist g(z)=c_0+c_1z+\cdots+c_{n-1}z^{n-1}使得

g(j)(λi)=f(j)(λi),j=0,1,2,,αi1;i=1,2,,Sg^{(j)}(\lambda_i)=f^{(j)}(\lambda_i),j=0,1,2,\cdots,\alpha_i -1;i=1,2,\cdots,S

插值计算例题

A=(1221)A=\begin{pmatrix}1&2\\2&1\end{pmatrix},求eAte^{At}

解:

xIA=(x3)[(x(1))]|xI-A|=(x-3)[(x-(-1))]

f(z)=ezt,g(z)=c0+c1zf(z)=e^{zt},g(z)=c_0+c_1z,求c0,c1c_0,c_1满足:

{f(3)=e3t=c0+3c1f(1)=et=c0c1\begin{cases} f(3)=e^{3t}=c_0+3c_1\\ f(-1)=e^{-t}=c_0-c_1 \end{cases}

从而f(A)=eAt=g(A)=c0I+c1Af(A)=e^{At}=g(A)=c_0I+c_1A

矩阵方程

AX=BAX=B

AX=BAX=B解存在性

  1. 代数判别法:r(AB)=r(A)r(A|B)=r(A)
  2. 几何判别法:ignore

如果BCm×1B\in\mathbb C^{m\times 1},则当且仅当AA是列满秩阵有解

AX=BAX=B解唯一性

  1. 代数方法:行满秩
  2. 几何方法:列向量组线性无关

左和右逆矩阵

ACm×nA\in\mathbb C^{m\times n}

  1. G,AG=Im    r(A)=m\exist G,AG=I_m \iff r(A)=m
  2. H,HA=In    r(A)=n\exist H,HA=I_n \iff r(A)=n
  3. H,G,HA=InAG=Im    r(A)=m=nG=H\exist H,G,HA=I_n\wedge AG=I_m \iff r(A)=m=n\wedge G=H

AX=BAX=B解法

引入P,Q,A=Q1APP,Q,\overset{\sim}{A}=Q^{-1}AP

从而方程转化为AP1X=Q1B\overset{\sim}{A}P^{-1}X=Q^{-1}B

其中:

P,QA\overset{\sim}{A}
可逆矩阵(J000)\begin{pmatrix}J&0\\0&0\end{pmatrix}
酉矩阵(Σ000)\begin{pmatrix}\Sigma&0\\0&0\end{pmatrix}

AX=BAX=B例题⭐️

AGA=AAGA=A,求证:AX=βAX=\beta有解    AGβ=β\iff AG\beta=\beta

证明: \lArr:

显然,X=GβX=G\beta是方程的解

\rArr:

由于方程有解决, β,X,AX=β\forall \beta,\exist X,AX=\beta,从而

β=AX=(AGA)X=AG(AX)=AGβ\beta=AX=(AGA)X=AG(AX)=AG\beta

AXXB=CAX-XB=C⭐️

Am×mXm×lXm×lAl×l=Cm×lA_{m\times m}X_{m\times l}-X_{m\times l}A_{l\times l}=C_{m\times l}

AXXB=CAX-XB=C解法思路

相似对角化,引入酉矩阵P,QP,Q,

AXXB=CAX-XB=C解的存在性与唯一性

V=Cm×l,φ:VV;XAXXBV=\mathbb C^{m\times l},\varphi:V\rarr V;X\mapsto AX-XB,则易得φ\varphi是线性算子。

VV上的一组基,则φ\varphi的矩阵表示为L,r=r(L)L,r=r(L)

从而:

  1. Imφ=V    r=mlIm\varphi=V\iff r=m\cdot l
  2. Kerφ={θV}    mlr=0Ker\varphi=\{\theta_V\}\iff m\cdot l-r=0

因此如果方程有解,这个解是唯一的。

如果Kerφ{θV}Ker\varphi\not=\{\theta_V\}

A,BA,B有公共特征值λ\lambda,则存在非零向量ξ,η,Aξ=ξλ,BTη=ηλ\xi,\eta,A\xi=\xi\lambda,B^T\eta=\eta\lambda

X0=ξηTX_0=\xi\eta^T,则AX0=XB0AX_0=XB_0

从而X0X_0AXXB=0AX-XB=0的一个非零解。

如果Kerφ={θV}Ker\varphi=\{\theta_V\}

A,BA,B没有公共特征值。

广义逆矩阵

MP-逆

ACm×nA\in\mathbb C^{m\times n}则若BCn×mB\in\mathbb C^{n\times m}使得

  1. ABA=AABA=A
  2. BAB=BBAB=B
  3. (AB)H=AB(AB)^H=AB
  4. (BA)H=BA(BA)^H=BA

则称BBAA的MP-逆。MP-逆总是唯一且存在。

证明:

  1. 如果A=0B=0A=0\rArr B=0
  2. 否则,存在酉矩阵P,Q,Q1AP=P,Q,Q^{-1}AP=,(Σ000)=C\begin{pmatrix}\Sigma&0\\0&0\end{pmatrix}=C,使得各条件均成立。

{1}逆和{1,2}逆

  1. A{1}={XAXA=A}A^{\{1\}}=\{X|AXA=A\}
  2. A{1,2}={XAXA=AXAX=X}A^{\{1,2\}}=\{X|AXA=A\wedge XAX=X\}

如果X,YX,Y均是AA的{1}逆,则XAYXAY也是AA的{1}逆