原图

向量空间

向量

n 个有序的数a1,a2,...,ana_1,a_2,...,a_n所组成的数组称为nn 维向量,这nn个数称为该向量的nn个分量,第ii个数aia_i称为第ii个分量。nn维向量可写成一行,也可写成一列。分别称为行向量和列向量:

  • n 维列向量:

(a1a2an)\begin{pmatrix}a_1\\a_2\\\vdots\\a_n\end{pmatrix}

  • 与 n 维行向量:

(a1,a2,...,an)或、quad(a1a2an)(a_1,a_2,...,a_n)\quad 或、quad \begin{pmatrix}a_1&a_2&\cdots&a_n\end{pmatrix}

nn也称为该向量的维数。

向量的基本运算法则

\begin{array}{c|c} \hline \\ \quad 加法、quad & \quad\begin{aligned} 交换律、\ 结合律 \end{aligned}\quad & \quad\begin{aligned}\boldsymbol{v}+\boldsymbol{u}=\boldsymbol{u}+\boldsymbol{v}\qquad\quad\\ \boldsymbol{u}+\boldsymbol{v}+\boldsymbol{w}=\boldsymbol{u}+(\boldsymbol{v}+\boldsymbol{w}) \end{aligned}\quad\\ \\ \hline \\ \quad 数乘、quad & \quad\begin{aligned} 交换律、\ 结合律、\分配律 \end{aligned}\quad & \quad\begin{aligned}k\cdot\boldsymbol{u}=\boldsymbol{u}\cdot k\qquad\ \ \\ k\cdot m\cdot\boldsymbol{u}=k\cdot(m\cdot\boldsymbol{u})\\k(\boldsymbol{u}+\boldsymbol{v})=k\boldsymbol{u}+k\boldsymbol{v}\ \ \end{aligned}\quad\\ \\ \hline \end{array}

线性组合

  • 向量组:
    若干同维数的列向量(或者同维数的行向量)所组成的集合,叫做向量组。比如同维数 的向量a1,a2,...am\boldsymbol{a_1},\boldsymbol{a_2},...\boldsymbol{a_m},可 以组成向量组A\mathcal{A},通常记作:

    A:a1,a2,...,am或、quadA={a1,a2,...,am}\mathcal{A}:\boldsymbol{a_1},\boldsymbol{a_2},...,\boldsymbol {a_m}\quad 或、quad \mathcal{A}=\{\boldsymbol{a_1},\boldsymbol {a_2},...,\boldsymbol{a_m}\}

  • 线性相关:
    给定向量组A={a1,a2,...,am}\mathcal{A}=\{\boldsymbol{a_1},\boldsymbol{a_2},..., \boldsymbol{a_m}\}和向量b\boldsymbol{b_{}},如果存在一组实数k1,k2,...kmk_1, k_2,...k_m,使:

    b=k1a1+k2a2+...+kmam\boldsymbol{b_{}}=k_1\boldsymbol{a_1}+k_2\boldsymbol{a_2}+... +k_m\boldsymbol{a_m}

    则称向量b\boldsymbol{b_{}}能由向量组A\mathcal{A} 线性表示,或称向量 b\boldsymbol{b_{}}是向量组A\mathcal{A}的线性组合。

  • 线性相关和线性无关:
    给定向量组A={a1,a2,...,am}\mathcal{A}=\{\boldsymbol{a_1},\boldsymbol{a_2},..., \boldsymbol{a_m}\},如果存在不全为零的实数k1,k2,...kmk_1,k_2,...k_m,使:

    k1a1+k2a2+...+kmam=0k_1\boldsymbol{a_1}+k_2\boldsymbol{a_2}+...+k_m\boldsymbol{a_m} =\boldsymbol{0}

    则称向量组A\mathcal{A}是线性相关的,否则称它为线性无关。

向量空间

V\mathcal{V}为一向量组,如果V\mathcal{V}非空,且V\mathcal{V}对于向量的加法及数乘两种运算封闭,那么就称V\mathcal{V}为向量空间。

所谓封闭,是指在V\mathcal{V}中向量进行数乘和加减,其结果依然在V\mathcal{V}中。具体的说,就是:

  • aV,bV\boldsymbol{a}\in \mathcal{V},\boldsymbol{b}\in \mathcal{V},则a+bV\boldsymbol{a}+\boldsymbol{b} \in \mathcal{V}
  • aV,kR\boldsymbol{a}\in \mathcal{V},k\in \mathbb{R},则kaVk\boldsymbol{a} \in \mathcal{V}

张成空间

张成空间的定义

某向量组A={v1,v2,...,vp}\mathcal{A}=\{\boldsymbol{v_1},\boldsymbol{v_2},...,\boldsymbol{v_p}\},其所有线性组合构成的集合为向量空间,也称为向量组A\mathcal{A}的张成空间,记为span(v1,v2,...,vp)span(\boldsymbol{v_1},\boldsymbol{v_2},...,\boldsymbol{v_p}),即:

span(v1,v2,...,vp)={k1v1+k2v2+...+kpvp,k1,2,...,pR}span(\boldsymbol{v_1},\boldsymbol{v_2},...,\boldsymbol{v_p})=\{k_1\boldsymbol{v_1}+k_2\boldsymbol{v_2}+...+k_p\boldsymbol{v_p},k_{1,2,...,p}\in\mathbb{R}\}

也称span(v1,v2,...,vp)span(\boldsymbol{v_1},\boldsymbol{v_2},...,\boldsymbol{v_p})为向量组A\mathcal{A}所张成。

等价向量组

设有两个向量组A={a1,a2,...,am}\mathcal{A}=\{\boldsymbol{a_1},\boldsymbol{a_2},...,\boldsymbol{a_m}\}B={b1,b2,...,bn}\mathcal{B}=\{\boldsymbol{b_1},\boldsymbol{b_2},...,\boldsymbol{b_n}\},若向量组B\mathcal{B}中的每个向量都能由向量组A\mathcal{A}线性表示,则称向量组B\mathcal{B}能由向量组A\mathcal{A}线性表示。

若向量组A\mathcal{A}与向量组B\mathcal{B}能相互线性表示,则称这两个向量组等价,也可以说A\mathcal{A}B\mathcal{B}是等价向量组。

最大无关组

设有向量组A\mathcal{A},如果在A\mathcal{A}中能选出rr个向量a1,a2,...,ar\boldsymbol{a_1},\boldsymbol{a_2},...,\boldsymbol{a_r}满足:

  • 向量组A0={a1,a2,...,ar}\mathcal{A}_0=\{\boldsymbol{a_1},\boldsymbol{a_2},...,\boldsymbol{a_r}\}线性无关。
  • 向量组A\mathcal{A}中任意r+1r+1个向量(如果A\mathcal{A}中有r+1r+1个向量的话)都线性相关,那么称向量组A0\mathcal{A}_0是向量组A\mathcal{A}的一个最大线性无关组,简称最大无关组。

向量组的秩

假设向量组AA的最大无关组为:

A0={a1,a2,,ar}\mathcal{A}_0=\{a_1,a_2,\cdots,a_r\}

A0\mathcal{A}_0的向量个数rr称为向量组A\mathcal{A}的秩,记做rank(A)rank(\mathcal{A}),有时也记作r(A)r(\mathcal{A})

向量空间的基

  • 基:
    已知V\mathcal{V}为向量空间,如果其中的某向量组:

    A={a1,a2,...an}\mathcal{A}=\{\boldsymbol{a_1},\boldsymbol{a_2},...\boldsymbol {a_n}\}

    V\mathcal{V}的最大无关组,那么向量组A\mathcal{A}被称为向量空间 V\mathcal{V}的一个基。

  • 坐标:
    假设A={a1,a2,...,an}\mathcal{A}=\{\boldsymbol{a_1},\boldsymbol{a_2},...,\boldsymbol{a_n}\}是向量空间V\mathcal{V}的一个基,则V\mathcal{V}中每个向量x\boldsymbol{x}可唯一地表示为:

    x=k1a1+k2a2++knan\boldsymbol{x}=k_1\boldsymbol{a_1}+k_2\boldsymbol{a_2}+\cdots +k_n\boldsymbol{a_n}

    上式的系数可以组成向量:

    [x]A=(k1k2kn)[\boldsymbol{x}]_\mathcal{A}=\begin{pmatrix}k_1\\k_2\\\vdots\\k_n\end{pmatrix}

    我们将其称为x\boldsymbol{x}在基A\mathcal{A}下的坐标向量,或者简称为x\boldsymbol{x}在基A\mathcal{A}下的坐标。

  • 维度:
    假设向量空间V\mathcal{V}的基为:

    A={a1,a2,,ar}\mathcal{A}=\{a_1,a_2,\cdots,a_r\}

    A\mathcal{A}的秩rr称为该向量空间的维度,或者称V\mathcal{V}rr维向量空间。

数量积(点积)

点积的定义

向量x=(x1xn)\boldsymbol{x}=\begin{pmatrix}x_1\\\vdots\\x_n\end{pmatrix}y=(y1yn)\boldsymbol{y}=\begin{pmatrix}y_1\\\vdots\\y_n\end{pmatrix}的点积(dotproduct)(dot product),或称内积(innerproduct)(inner product),定义为:

xy=x1y1++xnyn=i=1nxiyi\boldsymbol{x}\cdot\boldsymbol{y}=x_1y_1+\cdots+x_ny_n=\displaystyle\sum_{i=1}^{n}x_iy_i

点积还可以称为数量积或者标量积,这是因为两个向量通过点积运算之后的结果是数量(标量)。

点积的性质

交换律、quadab=ba数乘结合律、quad(ka)b=k(ba)分配律、quad(a+b)c=ac+bc\begin{array}{c|c} \hline \\ \quad 交换律、quad&\quad \boldsymbol{a}\cdot\boldsymbol{b}=\boldsymbol{b}\cdot\boldsymbol{a}\quad\\ \quad 数乘结合律、quad&\quad (k\boldsymbol{a})\cdot\boldsymbol{b}=k(\boldsymbol{b}\cdot\boldsymbol{a})\quad\\ \quad 分配律、quad&\quad (\boldsymbol{a}+\boldsymbol{b})\cdot\boldsymbol{c}=\boldsymbol{a}\cdot\boldsymbol{c}+\boldsymbol{b}\cdot\boldsymbol{c}\quad\\ \\ \hline \end{array}

矩阵和矩阵运算

矩阵的定义

m×nm\times n个数aij(i=1,2,...m;j=1,2...n)a_{ij}(i=1,2,...m;j=1,2...n)排成的mmnn列的数表称为mmnn列矩阵Matrix(Matrix),简称m×nm\times n矩阵。为表示这些数字是一个整体,总是加一个括弧,下面就表示了矩阵AA

A=(a11a12...a1na21a22...a2n.........am1am2...amn)n}mA=\underbrace{\begin{pmatrix}a_{11}&a_{12}&...&a_{1n}\\a_{21}&a_{22}&...&a_{2n}\\...&...&&...\\a_{m1}&a_{m2}&...&a_{mn}\end{pmatrix}}_{\large n 列}\left.\begin{aligned}\\\\\\\\\end{aligned}\right\}m 行

可以用aija_{ij}ai,ja_{i,j}来表示该矩阵AA的第iijj列的数字,刚才的矩阵还可以简记为:

A=(aij)=(ai,j)A=(a_{ij})=(a_{i,j})

为了表示矩阵的行数和列数,m×nm\times n矩阵AA也记作Am×nA_{m\times n}

高斯消元法

  • 行阶梯形矩阵:
    非零矩阵若满足:

    • 非零行在零行(如果存在的话)的上面
    • 非零行最左边的首非零元素在上一行(如果存在的话)的首非零元素的右面

    所以称为行阶梯形矩阵(Row echelon form),非零行最左边的首非零元素称为主元(Pivot element)。

  • 对角矩阵:
    若 n 阶方阵如下:

    Λn=(λ10...00λ2...0.........00...λn)\Lambda_{n}=\begin{pmatrix}\lambda_1&0&...&0\\0&\lambda_2&...&0\\...&...&&...\\ 0&0&...&\lambda_n\end{pmatrix}

    对角线以外的元素都是 0,这种方阵称为对角矩阵(Diagonal matrix),简称对角阵,也记作:

    Λn=diag(λ1,λ2,...,λn)\Lambda_{n}=diag(\lambda_1,\lambda_2,...,\lambda_n)

  • 单位阵:
    如果 n 阶对角阵的对角线上的元素全为 1:

    In=(10...001...0.........00...1)I_n=\begin{pmatrix}1&0&...&0\\0&1&...&0\\...&...&&...\\ 0&0&...&1\end{pmatrix}

    该对角阵称为 n 阶单位矩阵(Identity matrix),或者简称为单位阵。在国内教材中,单位阵一般用 E 表示。

  • 行最简形矩阵:
    若 A 是行阶梯形矩阵,并且还满足:

    • 主元为 1
    • 除主元外,其所在列的其它元素均为 0

    则称 A 为行最简形矩阵(Reduced row echelon form).

  • 初等行变换和初等行矩阵:
    完成高斯消元法只需要三种操作,这三种操作是作用在矩阵的行上的,所以又称为初等行变换(Elementary row operations)。在单位阵上应用这三种初等行变换一次得到的矩阵称为初等行矩阵(Elementary row matrix),也就是下列表格中最右的矩阵:

    初等行变换、quad操作、quad初等行矩阵、quad倍加变换row-addition transformationsr1=r1+kr2(1k0010001)倍乘变换row-multiplying transformationsr1=kr1(k0)(k00010001)对换变换row-switching transformationsr1r2(010100001)\begin{array}{c|c|c} \hline \quad 初等行变换、quad &\quad 操作、quad &\quad 初等行矩阵、quad\\ \hline \\ \quad \begin{aligned}\color{SkyBlue}{倍加变换} \qquad\qquad\quad\\\text{row-addition transformations}\end {aligned}\quad &\quad \boldsymbol{r_1}'=\boldsymbol{r_1} +k\boldsymbol{r_2}\quad &\quad \begin{pmatrix}1&{\color{red} {k}}&0\\0&1&0\\0&0&1\end{pmatrix}\quad \\ \hline \\ \quad \begin{aligned}\color{Goldenrod}{倍乘变换} \qquad\qquad\quad\\\text{row-multiplying transformations} \end{aligned}\quad &\quad \boldsymbol{r_1}'=k\boldsymbol {r_1} (k\neq 0)\quad & \quad \begin{pmatrix}{\color{red}{k}}&0&0\\0&1&0\\0&0&1\end {pmatrix}\quad \\ \\ \hline \\ \quad \begin{aligned}\color{orange}{对换变换} \qquad\qquad\quad\\\text{row-switching transformations}\end {aligned}\quad &\quad \boldsymbol{r_1}\leftrightarrow \boldsymbol{r_2}\quad & \quad \begin{pmatrix}{\color{red}{0}}&{\color{red}{1}}& {\color{red}{0}}\\ {\color{red}{1}}&{\color{red}{0}}&{\color{red}{0}}\\0&0& 1\end{pmatrix}\quad \\ \\ \hline \end{array}

    初等行矩阵乘上矩阵 A,就相当于在矩阵 A 上实施了对应的初等行变换。

矩阵的加法与乘法

两个矩阵的行数相等、列数也相等时,就称它们是同型矩阵。

  • 加法:
    设有两个m×nm\times n矩阵A=(aij)A=(a_{ij})B=(bij)B=(b_{ij}),那么矩阵AABB的和记做A+BA+B,规定为:

    A+B=(a11+b11a12+b12...a1n+b1na21+b21a22+b22...a2n+b2n.........am1+bm1am2+bm2...amn+bmn)A+B=\begin{pmatrix}a_{11}+b_{11}&a_{12}+b_{12}&...&a_{1n}+b_{1n}\\a_{21}+b_{21}&a_{22}+b_{22}&...&a_{2n}+b_{2n}\\ ...&...&&...\\a_{m1}+b_{m1}&a_{m2}+b_{m2}&...&a_{mn}+b_{mn}\end{pmatrix}

  • 矩阵加法运算规律:

    交换律、quadA+B=B+A结合律、quad(A+B)+C=A+(B+C)\begin{array}{c|c} \hline \\ \quad 交换律、quad&\quad A+B=B+A\quad\\ \quad 结合律、quad&\quad (A+B)+C=A+(B+C)\quad\\ \\ \hline \end{array}

  • 矩阵数乘:
    kk与矩阵AA的乘积记作:

    kA或、quadAkkA\quad 或、quad Ak

    规定为:

    kA=Ak=(ka11ka12ka1nka21ka22ka2nkam1kam2kamn)kA=Ak= \begin{pmatrix} ka_{11}&ka_{12}&\cdots&ka_{1n}\\ ka_{21}&ka_{22}&\cdots&ka_{2n}\\ \cdots&\cdots& &\cdots\\ ka_{m1}&ka_{m2}&\cdots&ka_{mn}\end{pmatrix}

  • 数乘的运算规律:

    结合律、quad(λμ)A=λ(μA)分配律、quad(λ+μ)A=λA+μAλ(A+B)=λA+λB\begin{array}{c|c} \hline \\ \quad 结合律、quad&\quad (\lambda\mu) A=\lambda(\mu A)\quad\\ \\ \quad 分配律、quad&\quad \begin{aligned}(\lambda+\mu) A=\lambda A+\mu A\\\lambda(A+B)=\lambda A+\lambda B\end {aligned}\quad\\ \\ \hline \end{array}

  • 矩阵乘法的定义:
    A=(aij)A=(a_{ij})是一个m×sm\times s矩阵,B=(bij)B=(b_{ij})是一个s×ns\times n矩阵,那么规定AABB的乘积是一个m×nm\times n矩阵C=(cij)C=(c_{ij}),其中:

    cij=aibj=ai1b1j+ai2b2j+...+aisbsj=k=1saikbkj(i=1,,m;j=1,,n)c_{ij}=\boldsymbol{a}_{i*}\cdot\boldsymbol{b}_{*j}=a_{i1}b_{1j} +a_{i2}b_{2j}+...+a_{is}b_{sj}=\displaystyle \sum_{k=1}^s a_{ik} b_{kj} (i=1,\cdots,m;j=1,\cdots,n)

    并把乘积记作:

    C=ABC=AB

  • 矩阵乘法运算规律:

    交换律、quad不一定满足、quad数乘交换律、quadλ(AB)=(λA)B=A(λB)(其中、lambda是数)结合律、quad(AB)C=A(BC)分配律、quadA(B+C)=AB+AC\begin{array}{c|c} \hline \\ \quad 交换律、quad&\quad 不一定满足、quad\\ \quad 数乘交换律、quad&\quad \lambda(AB)=(\lambda A)B=A (\lambda B)(其中、lambda 是数)\quad\\ \quad 结合律、quad&\quad (AB)C=A(BC)\quad\\ \quad 分配律、quad&\quad A(B+C)=AB+AC\quad\\ \\ \hline \end{array}

矩阵的幂与转置

类似于xnx^n称为xx的幂运算,矩阵也有幂运算,也称为矩阵的幂:
AA是方阵,定义:

A1=A,A2=A1A1,,Ak+1=AkA1A^1=A,\quad A^2=A^1A^1,\quad\cdots,\quad A^{k+1}=A^kA^1

其中 k 为正整数。

  • 矩阵的转置:
    把矩阵AA的行换成同序数的列,该操作称为矩阵的转置运算。转置运算后可以得到一个新矩阵,该矩阵称为 A 的转置矩阵,记作ATA^\mathrm{T}。或者用符号表示如下:

    A=(aij),AT=(aji)A=(a_{ij}),\quad A^\mathrm{T}=(a_{ji})

  • 转置的性质:

    (AT)T=A(A^\mathrm{T})^\mathrm{T}=A

    (AB)\mathrm{T}=B\mathrm{T}A^\mathrm{T}

    (AT)n=(An)T(A^\mathrm{T})^n=(A^n)^\mathrm{T}

    (A+B)\mathrm{T}=A\mathrm{T}+B^\mathrm{T}

    对于两个同维向量$\boldsymbol{x}$和$\boldsymbol{y}$,有:

    \boldsymbol{x}^\mathrm{T}\boldsymbol{y}=(\boldsymbol{x}\cdot\boldsymbol{y})

    若:

    AT=AA^T=A

    则矩阵 A 称为对称矩阵。

    若:

    AT=AA^T=-A

    则矩阵 A 称为反对称矩阵。

矩阵函数

其实,任给一个 RGB 都可以如上转为对应的YPrPbYP_rP_b。为了表明这一点,我们用未知向量xy\boldsymbol{x}、\boldsymbol{y}来替换常向量ab\boldsymbol{a}、\boldsymbol{b}

(0.2990.5870.1140.50.4186880.0813120.1687360.3312640.5)A (RGB)x = (YPrPb)y\underbrace{\begin{pmatrix}0.299&0.587&0.114\\0.5&-0.418688&-0.081312\\-0.168736&-0.331264&0.5\end{pmatrix}}_{\large \boldsymbol{A}}\ \underbrace{\begin{pmatrix}R\\G\\B\end{pmatrix}}_{\large \boldsymbol{x}}\ =\ \underbrace{\begin{pmatrix}Y\\P_r\\P_b\end{pmatrix}}_{\large \boldsymbol{y}}

这样就得到了函数Ax=y()\boldsymbol{A}\boldsymbol{x}=\boldsymbol{y}(),也称为矩阵函数,其输入为x\boldsymbol{x},输出为y\boldsymbol{y}

矩阵函数的性质

交换律、quad不一定满足、quad数乘交换律、quadλ(AB)=(λA)B=A(λB)(其中、lambda是数)结合律、quad(AB)C=A(BC)分配律、quadA(B+C)=AB+AC\begin{array}{c|c} \hline \\ \quad 交换律、quad&\quad 不一定满足、quad\\ \quad 数乘交换律、quad&\quad \lambda(AB)=(\lambda A)B=A(\lambda B)(其中、lambda 是数)\quad\\ \quad 结合律、quad&\quad (AB)C=A(BC)\quad\\ \quad 分配律、quad&\quad A(B+C)=AB+AC\quad\\ \\ \hline \end{array}

矩阵的秩

行秩和列秩

列空间

矩阵 A 的列向量为:

A=(a11a12a1na21a22a2nam1am2amn)=(c1,c2,,cn)A= \begin{pmatrix} {\color{green}{a_{11}}}&{\color{blue}{a_{12}}}&\cdots&{\color{purple}{a_{1n}}}\\ {\color{green}{a_{21}}}&{\color{blue}{a_{22}}}&\cdots&{\color{purple}{a_{2n}}}\\ \vdots&\vdots&\quad&\vdots\\ {\color{green}{a_{m1}}}&{\color{blue}{a_{m2}}}&\cdots&{\color{purple}{a_{mn}}} \end{pmatrix} =({\color{green}{\boldsymbol{c_1}}},{\color{blue}{\boldsymbol{c_2}}},\cdots,{\color{purple}{\boldsymbol{c_n}}})

包含所有列向量的向量组称为列向量组,即:

列向量组:{c1,c2,,cn}列向量组:\{\boldsymbol{c_1},\boldsymbol{c_2},\cdots,\boldsymbol{c_n}\}

列向量组的张成空间称为列空间,记作colsp(A)colsp(A),即:

colsp(A)=span({c1,c2,,cn})=x1c1+x2c2++xncn,x1,2,,nR\begin{aligned} colsp(A) &=span(\{\boldsymbol{c_1},\boldsymbol{c_2},\cdots,\boldsymbol{c_n}\})\\ &=x_1\boldsymbol{c_1}+x_2\boldsymbol{c_2}+\cdots+x_n\boldsymbol{c_n},\quad x_{1,2,\cdots,n}\in\mathbb{R} \end{aligned}

列向量组的秩,也就是列空间的维度,称为列秩,即:

列秩=rank(colsp(A))列秩=rank(colsp(A))

如果列向量组线性无关,就称为列满秩。

行空间

矩阵 A 的行向量为:

A=(a11a12a1na21a22a2nam1am2amn)=(r1Tr2TrmT)A= \begin{pmatrix} {\color{green}{a_{11}}}&{\color{green}{a_{12}}}&\cdots&{\color{green}{a_{1n}}}\\ {\color{blue}{a_{21}}}&{\color{blue}{a_{22}}}&\cdots&{\color{blue}{a_{2n}}}\\ \vdots&\vdots&\quad&\vdots\\ {\color{purple}{a_{m1}}}&{\color{purple}{a_{m2}}}&\cdots&{\color{purple}{a_{mn}}} \end{pmatrix} =\begin{pmatrix}{\color{green}{\boldsymbol{r_1}^\mathrm{T}}}\\{\color{blue}{\boldsymbol{r_2}^\mathrm{T}}}\\\vdots\\{\color{purple}{\boldsymbol{r_m}^\mathrm{T}}}\end{pmatrix}

包含所有行向量的向量组称为行向量组,即:

行向量组:{r1T,r2T,,rmT}行向量组:\{\boldsymbol{r_1}^\mathrm{T},\boldsymbol{r_2}^\mathrm{T},\cdots,\boldsymbol{r_m}^\mathrm{T}\}

行向量组的张成空间称为行空间,记作rowsp(A)rowsp(A),即:

rowsp(A)=span({r1T,r2T,,rmT})=x1r1T+x2r2T++xmrmT,x1,2,,mR\begin{aligned} rowsp(A) &=span(\{\boldsymbol{r_1}^\mathrm{T},\boldsymbol{r_2}^\mathrm{T},\cdots,\boldsymbol{r_m}^\mathrm{T}\})\\ &=x_1\boldsymbol{r_1}^\mathrm{T}+x_2\boldsymbol{r_2}^\mathrm{T}+\cdots+x_m\boldsymbol{r_m}^\mathrm{T},\quad x_{1,2,\cdots,m}\in\mathbb{R} \end{aligned}

行向量组的秩,也就是行空间的维度,称为行秩,即:

行秩=rank(rowsp(A))行秩=rank(rowsp(A))

如果行向量组线性无关,就称为行满秩。

  • 矩阵的秩的定义:
    对于任意矩阵,始终有列秩等于行秩,所以统称为矩阵的秩,即:

    矩阵的秩=列秩=行秩矩阵的秩=列秩=行秩

    矩阵 A 的秩记作rank(A)rank(A),有时也简写为r(A)r(A)

  • 秩的几何意义:
    根据自然定义域下,矩阵函数的值域可知,在自然定义域下

    • 列向量矩阵函数Ax=yA\boldsymbol{x}=\boldsymbol{y}的值域的维度是列秩
    • 行向量矩阵函数xTA=yT\boldsymbol{x}^\mathrm{T}A=\boldsymbol{y}^\mathrm{T}的值域的维度是行秩

    因为行秩=列秩=秩,所以当在自然定义域下时,秩就是矩阵函数的值域的维度。下面来看几个例子。

  • 满秩:
    如果某个矩阵,既是列满秩,又是行满秩,那么就称该矩阵为满秩矩阵,或者简称为满秩。满秩矩阵必为方阵。

  • 秩的性质:

    • 秩的取值范围:

    0rank(Am×n)min(m,n)0\le rank(A_{m\times n})\le\min(m,n)

    • 转置矩阵的秩:

    rank(A)=rank(AT)rank(A)=rank(A^\mathrm{T})

    • 复合函数的秩:

    rank(AB)min(rank(A),rank(B))rank(AB)\leq\min\Big(rank(A),rank(B)\Big)

    • 满秩矩阵复合的秩。假设 P、Q 为满秩矩阵,那么:

    rank(PA)=rank(AQ)=rank(PAQ)=rank(A)rank(PA)=rank(AQ)=rank(PAQ)=rank(A)

    • 矩阵相加的秩。假设 A、B 为同型矩阵,那么:

    rank(A+B)rank(A)+rank(B)rank(A+B)\le rank(A)+rank(B)

逆矩阵

逆矩阵的定义

若存在两个nn阶方阵AC\boldsymbol{A}、\boldsymbol{C},两者的乘积为nn阶单位阵I\boldsymbol{I}

AC=I且、qquadCA=I\boldsymbol{A}\boldsymbol{C}=\boldsymbol{I}\qquad 且、qquad \boldsymbol{C}\boldsymbol{A}=\boldsymbol{I}

那么C\boldsymbol{C}就是A\boldsymbol{A}的逆矩阵,即有A1=C\boldsymbol{A}^{-1}=\boldsymbol{C},且A1\boldsymbol{A}^{-1}是唯一的。

如果可以通过一系列初等行矩阵Ei\boldsymbol{E}_i,将矩阵A\boldsymbol{A}变换成单位阵I\boldsymbol{I},则A\boldsymbol{A}的逆矩阵就是这些初等行矩阵的乘积:

E1E2...EnA1A=I\underbrace{\boldsymbol{E}_1\boldsymbol{E}_2...\boldsymbol{E}_n}_{\boldsymbol{A}^{-1}}\boldsymbol{A}=\boldsymbol{I}

逆矩阵的运算规律

A\boldsymbol{A}可逆,则A1\boldsymbol{A}^{-1}也可逆,且:

(A1)1=A(\boldsymbol{A}^{-1})^{-1}=\boldsymbol{A}

A\boldsymbol{A}可逆,数λ0\lambda\ne 0,则λA\lambda\boldsymbol{A}可逆,且:

(λA)1=1λA1(\lambda\boldsymbol{A})^{-1}=\frac{1}{\lambda}\boldsymbol{A}^{-1}

AB\boldsymbol{A}、\boldsymbol{B}为同阶方阵且均可逆,则AB\boldsymbol{A}\boldsymbol{B}也可逆,且:

(AB)1=B1A1(\boldsymbol{A}\boldsymbol{B})^{-1}=\boldsymbol{B}^{-1}\boldsymbol{A}^{-1}

A\boldsymbol{A}可逆,则AT\boldsymbol{A}^\mathrm{T}也可逆,且:

(AT)1=(A1)T(\boldsymbol{A}^\mathrm{T})^{-1}=(\boldsymbol{A}^{-1})^\mathrm{T}

线性方程组的求解

  • 解的存在性
    对于线性方程组Ax=b\boldsymbol{A}\boldsymbol{x}=\boldsymbol{b},它的增广矩阵为B=(A  b)\boldsymbol{B}=(\boldsymbol{A}\ |\ \boldsymbol{b_{}}),那么:

    • 有解,当且仅当rank(A)=rank(B)rank(\boldsymbol{A})=rank(\boldsymbol{B})
    • 无解,当且仅当rank(A)<rank(B)rank(\boldsymbol{A}) < rank(\boldsymbol{B})

    行满秩矩阵一定有解

  • 解的个数判别法:
    对于线性方程组Ax=b\boldsymbol{A}\boldsymbol{x}=\boldsymbol{b},它的增广矩阵为B=(A  b)\boldsymbol{B}=(\boldsymbol{A}\ |\ \boldsymbol{b_{}}),如果A\boldsymbol{A}m×nm\times n的矩阵,那么:

    • 有唯一解,当且仅当rank(A)=rank(B)=nrank(\boldsymbol{A})=rank(\boldsymbol{B})=n
    • 有无数解,当且仅当rank(A)=rank(B)<nrank(\boldsymbol{A})=rank(\boldsymbol{B})<n

    满秩矩阵解有唯一解

行列式

行列式定义

二阶行列式

假设有二阶方阵A=(a11a12a21a22)\boldsymbol{A}=\begin{pmatrix}a_{11}&a_{12}\\a_{21}&a_{22}\end{pmatrix},那么刚才定义的运算规则称为该二阶方阵A\boldsymbol{A}对应的行列式A|\boldsymbol{A}|,也称为二阶行列式:

A=a11a12a21a22=a11a22a12a21|\boldsymbol{A}|=\begin{vmatrix}a_{11}&a_{12}\\a_{21}&a_{22}\end{vmatrix}=a_{11}a_{22}-a_{12}a_{21}

上述定义只要求A\boldsymbol{A}是方阵,不要求是满秩矩阵。

三阶行列式

假设有三阶方阵A=(a11a12a13a21a22a23a31a32a33)\boldsymbol{A}=\begin{pmatrix}a_{11}&a_{12}&a_{13}\\a_{21}&a_{22}&a_{23}\\a_{31}&a_{32}&a_{33}\end{pmatrix},那么刚才定义的运算规则称为该三阶方阵A\boldsymbol{A}对应的行列式A|\boldsymbol{A}|,也称为三阶行列式:

A=a11a12a13a21a22a23a31a32a33=a11a22a33+a12a23a31+a13a21a32a11a23a32a12a21a33a13a22a31\begin{aligned} |\boldsymbol{A}| &=\begin{vmatrix}a_{11}&a_{12}&a_{13}\\a_{21}&a_{22}&a_{23}\\a_{31}&a_{32}&a_{33}\end{vmatrix}\\ &=a_{11}a_{22}a_{33}+a_{12}a_{23}a_{31}+a_{13}a_{21}a_{32}-a_{11}a_{23}a_{32}-a_{12}a_{21}a_{33}-a_{13}a_{22}a_{31} \end{aligned}

上述定义也只要求、boldsymbol{A}是方阵,不要求是满秩矩阵。

全排列

把 n 个不同的元素排成一列,叫做这 n 个元素的全排列。

逆序数

在一个排列(也就是数列)中,如果一对数的前后位置与大小顺序相反,即前面的数大于后面的数,那么它们就称为一个逆序。一个排列中逆序的总数就称为该排列的逆序数。逆序数为奇数的排列称为奇排列,逆序数为偶数的排列称为偶排列。

行列式定义

对于nn阶方阵A=(aij)\boldsymbol{A}=(a_{ij}),其行列式定义为:

A=aij=a11a12a1na21a22a2nan1an2ann=(1)ta1p1a2p2anpn |\boldsymbol{A}|=|a_{ij}|=\begin{vmatrix} a_{11}&a_{12}&\cdots&a_{1n}\\ a_{21}&a_{22}&\cdots&a_{2n}\\ \vdots&\vdots&\quad&\vdots\\ a_{n1}&a_{n2}&\cdots&a_{nn} \end{vmatrix}=\sum(-1)^ta_{1p_1}a_{2p_2}\cdots a_{np_n}

其中,tt为排列p1p2pnp_1p_2\cdots p_n的逆序数,\sum表示对1,2,,n“1,2,\cdots,n”的全排列p1p2pn“p_1p_2\cdots p_n”求和。

向量积

向量积S\boldsymbol{S}投影到了各个平面:

S投影、quad{SxoySyozSzox\boldsymbol{S}\xrightarrow{\quad 投影、quad} \begin{cases} \boldsymbol{S_{xoy}}\\ \boldsymbol{S_{yoz}}\\ \boldsymbol{S_{zox}} \end{cases}

将这些投影加起来就得到了向量积S\boldsymbol{S}

S=b×c=Sxoy+Syoz+Szox=b1c1b2c2e3+b2c2b3c3e1+b3c3b1c1e2=b2c2b3c3e1+b3c3b1c1e2+b1c1b2c2e3\begin{aligned} \boldsymbol{S} &=\boldsymbol{b}\times\boldsymbol{c}\\ \quad\\ &=\boldsymbol{S_{xoy}}+\boldsymbol{S_{yoz}}+\boldsymbol{S_{zox}}\\ \quad\\ &=\begin{vmatrix}b_1&c_1\\b_2&c_2\end{vmatrix}\boldsymbol{e_3}+\begin{vmatrix}b_2&c_2\\b_3&c_3\end{vmatrix}\boldsymbol{e_1}+\begin{vmatrix}b_3&c_3\\b_1&c_1\end{vmatrix}\boldsymbol{e_2}\\ \quad\\ &=\begin{vmatrix}b_2&c_2\\b_3&c_3\end{vmatrix}\boldsymbol{e_1}+\begin{vmatrix}b_3&c_3\\b_1&c_1\end{vmatrix}\boldsymbol{e_2}+\begin{vmatrix}b_1&c_1\\b_2&c_2\end{vmatrix}\boldsymbol{e_3} \end{aligned}

为了方便记忆,上面的式子往往如下书写,这就是向量积的定义:

b×c=b2c2b3c3e1b1c1b3c3e2+b1c1b2c2e3\boldsymbol{b}\times\boldsymbol{c}=\begin{vmatrix}b_2&c_2\\b_3&c_3\end{vmatrix}\boldsymbol{e_1}-\begin{vmatrix}b_1&c_1\\b_3&c_3\end{vmatrix}\boldsymbol{e_2}+\begin{vmatrix}b_1&c_1\\b_2&c_2\end{vmatrix}\boldsymbol{e_3}

子式和余子式

子式

m×nm\times n矩阵A\boldsymbol{A}中,任取 k 行与 k 列km,kn(k\le m,k\le n),位于这些行、列交叉处的k2k^2个元素,不改变它们在A\boldsymbol{A}中所处的位置次序而得的 k 阶行列式,称为矩阵A\boldsymbol{A}的 k 阶子式(Minor)。

A\boldsymbol{A}m×nm\times n的矩阵,II是集合{1,...,m}\{1,...,m\}的一个kk元子集,JJ是集合{1,...,n}\{1,...,n\}的一个kk元子集,AI,J|\boldsymbol{A}|_{I,J}A\boldsymbol{A}kk阶子式,其中抽取的 k 行的行号是 I 中所有元素,kk列的列号是JJ中所有元素。那么:

  • 如果I=JI=J,称AI,J为、boldsymbolA|\boldsymbol{A}|_{I,J}为、boldsymbol{A}kk阶主子式(Principal minor)。
  • 如果I=J={1,,k}I=J=\{1,\cdots,k\}所取的是左起前 k 列和上起前kk行),称AI,J|\boldsymbol{A}|_{I,J}A\boldsymbol{A}kk阶顺序主子式(Leading principal minor)。

设在矩阵A\boldsymbol{A}中有一个不等于 0 的 r 阶子式Br|\boldsymbol{B}_{r}|,且所有r+1r+1阶子式(如果存在的话)全等于 0,那么Br|\boldsymbol{B}_{r}|称为矩阵A\boldsymbol{A}的最高阶非零子式,数 r 称为矩阵A\boldsymbol{A}的秩。(不适合求矩阵的秩,太麻烦)

余子式

在 n 阶行列式中,把aija_{ij}所在的第 i 行和第 j 列划去后,留下来的 n-1 阶行列式叫做aija_{ij}的余子式,记做Mij\boldsymbol{M}_{ij}.

代数余子式

aija_{ij}的余子式MijM_{ij}的基础上,还可以定义AijA_{ij},称为aija_{ij}的代数余子式:

Aij=(1)i+jMijA_{ij}=(-1)^{i+j}M_{ij}

总结

行列式的性质

  • 行列式转置:
    对于 n 阶方阵A=(aij)\boldsymbol{A}=(a_{ij}),有:

    A=a11a12a1na21a22a2nan1an2ann,AT=a11a21an1a12a22an2a1na2nann|\boldsymbol{A}|= \begin{vmatrix} a_{11}&a_{12}&\cdots&a_{1n}\\ a_{21}&a_{22}&\cdots&a_{2n}\\ \vdots&\vdots&\quad&\vdots\\ a_{n1}&a_{n2}&\cdots&a_{nn} \end{vmatrix},\quad |\boldsymbol{A}^\mathrm{T}|= \begin{vmatrix} a_{11}&a_{21}&\cdots&a_{n1}\\ a_{12}&a_{22}&\cdots&a_{n2}\\ \vdots&\vdots&\quad&\vdots\\ a_{1n}&a_{2n}&\cdots&a_{nn} \end{vmatrix}

    行列式AT|\boldsymbol{A}^\mathrm{T}|称为行列式A|\boldsymbol{A}|的转 置行列式。可以证明:

    A=AT|\boldsymbol{A}|=|\boldsymbol{A}^\mathrm{T}|

  • 满秩、可逆与行列式:
    对于方阵A\boldsymbol{A}有:

    A0    A 满秩、iffA 可逆|\boldsymbol{A}|\ne 0\iff \boldsymbol{A}\ 满秩、iff \boldsymbol{A}\ 可逆

  • 行列式的数乘:
    行列式乘以 k 倍,等于某行(列)乘以 k,该性质也可以称为行列式的数乘:

\begin{vmatrix}
a_{11}&a_{12}&\dots &a_{1n}\
\vdots &\vdots &\ddots &\vdots\
a_{n1}&a_{n2}&\dots &a_{nn}
\end{vmatrix}

\begin{vmatrix}
a_{11}&a_{12}&\dots&a_{1n}\
\vdots &\vdots &\ddots &\vdots\
{\color {blue}k}a_{i1}&{\color{blue}k}a_{i2}&\dots&{\color{blue}k}a_{in}\
\vdots &\vdots &\ddots &\vdots \
a_{n1}&a_{n2}&\dots &a_{nn}
\end{vmatrix}

\begin{vmatrix}
a_{11}&\dots&{\color {blue}k}a_{1j}&\dots &a_{1n}\
\vdots &\dots&{\color {blue}k}a_{2j} &\dots &\vdots \
\vdots &\ddots&\vdots&\ddots &\vdots
\a_{n1}&\dots&{\color {blue}k}a_{nj}&\dots &a_{nn}
\end{vmatrix}
$$

  • 行或列互换:
    行列式中的行(列)互换后,行列式正负号发生改变:

    \vdots &\vdots &\vdots &\vdots \
    {\color{blue}{a_{i1}}}&{\color{blue}{a_{i2}}}&\dots&{\color{blue}{a_{in}}}\
    \vdots &\vdots &\vdots &\vdots \
    {\color{ForestGreen}{a_{j1}}}&{\color{ForestGreen}{a_{j2}}}&\dots&{\color{ForestGreen}{a_{jn}}}\
    \vdots &\vdots &\vdots &\vdots \
    \end{vmatrix}
    =
    -\begin{vmatrix}
    \vdots &\vdots &\vdots &\vdots \
    {\color{ForestGreen}{a_{j1}}}&{\color{ForestGreen}{a_{j2}}}&\dots&{\color{ForestGreen}{a_{jn}}}\
    \vdots &\vdots &\vdots &\vdots \
    {\color{blue}{a_{i1}}}&{\color{blue}{a_{i2}}}&\dots&{\color{blue}{a_{in}}}\
    \vdots &\vdots &\vdots &\vdots \
    \end{vmatrix}

行列式的倍加:将一行(列)的k倍加进另一行(列)里,行列式的值不变,该性质也可以称为行列式的倍加: - 行列式的倍加: 将一行(列)的 k 倍加进另一行(列)里,行列式的值不变,该性质也可以称为行列式的倍加:

\begin{vmatrix}
\vdots &\vdots &\vdots &\vdots \
a_{i1}&a_{i2}&\dots &a_{in}\
a_{j1}&a_{j2}&\dots &a_{jn}\
\vdots &\vdots &\vdots &\vdots
\end{vmatrix}

\begin{vmatrix}
\vdots &\vdots &\vdots &\vdots\
a_{i1}&a_{i2}&\dots &a_{in}\
a_{j1}{\color{blue}{+ka_{i1}}}&a_{j2}{\color{blue}{+ka_{i2}}}&\dots&a_{jn}{\color{blue}{+ka_{in}}}\
\vdots &\vdots &\vdots &\vdots
\end{vmatrix}

行列式的加法:在行列式中,某一行(列)的每个元素是两数之和,则此行列式可拆分为两个相加的行列式,该性质也可以称为行列式的加法: - 行列式的加法: 在行列式中,某一行(列)的每个元素是两数之和,则此行列式可拆分为两个相加的行列式,该性质也可以称为行列式的加法:

\begin{vmatrix}
a_{11}&a_{12}&\dots &a_{1n}\
\vdots &\vdots &\dots &\vdots\
{\color{blue}{a_{i1}}}+{\color{ForestGreen}{b_{i1}}}&{\color{blue}a_{i2}}+{\color{ForestGreen}{b_{i2}}}&\dots&{\color{blue}{a_{in}}}+{\color{ForestGreen}{b_{in}}}\
\vdots &\vdots &\ddots &\vdots\
a_{n1}&a_{n2}&\dots &a_{nn}
\end{vmatrix} =
\begin{vmatrix}
a_{11}&a_{12}&\dots &a_{1n}\
\vdots &\vdots &\dots &\vdots\
{\color{blue}{a_{i1}}}&{\color{blue}{a_{i2}}}&\dots&{\color{blue}{a_{in}}}\
\vdots &\vdots &\ddots &\vdots\
a_{n1}&a_{n2}&\dots &a_{nn}
\end{vmatrix} +
\begin{vmatrix}
a_{11}&a_{12}&\dots &a_{1n}\
\vdots &\vdots &\dots &\vdots
\{\color{ForestGreen}{b_{i1}}}&{\color{ForestGreen}{b_{i2}}}&\dots &{\color{ForestGreen}{b_{in}}}\
\vdots &\vdots &\ddots &\vdots\
a_{n1}&a_{n2}&\dots &a_{nn}
\end{vmatrix}
$$

  • 行列式的乘法:
    对于同阶方阵A,B\boldsymbol{A},\boldsymbol{B},有:

    AB=AB|\boldsymbol{A}\boldsymbol{B}|=|\boldsymbol{A}||\boldsymbol{B}|

    该性质又称为行列式的乘法。

  • 三角行列式的计算法:

\begin{vmatrix}
a_{11}&&&\
a_{21}&a_{22}&&0\
\vdots &\vdots &\ddots &\
a_{n1}&a_{n2}&\dots &a_{nn}
\end{vmatrix}
= a_{11}a_{22}\cdots a_{nn}

三角分块行列式的计算法:设有分块矩阵: - 三角分块行列式的计算法: 设有分块矩阵:

\boldsymbol{A}=\begin{pmatrix}\boldsymbol{B}&\boldsymbol{O}\\\boldsymbol{C}&\boldsymbol{D}\end{pmatrix}
$$
则有:
$$
|\boldsymbol{A}|=|\boldsymbol{B}||\boldsymbol{D}|
$$
该性质也称为三角分块行列式的计算法。
  • 拉普拉斯展开:
    n 阶方阵A=(aij)\boldsymbol{A}=(a_{ij})的行列式可以表示成关于该方阵A\boldsymbol{A}的某一行的各元素与其对应的代数余子式乘积之和,即:

    A=ai1Ai1+ai2Ai2+...+ainAin(i=1,2,...,n)|\boldsymbol{A}|=a_{i1}A_{i1}+a_{i2}A_{i2}+...+a_{in}A_{in}\quad (i=1,2,...,n)

    或表示成关于该方阵 A 的某一列的各元素与其对应的代数余子式乘积之和:

    A=a1jA1j+a2jA2j+...+anjAnj(j=1,2,...,n)|\boldsymbol{A}|=a_{1j}A_{1j}+a_{2j}A_{2j}+...+a_{nj}A_{nj}\quad (j=1,2,...,n)

    这种计算行列式的方法称为拉普拉斯展开(Laplace expansion)。

克拉默法则

有 n 个未知数,n 个方程所组成的线性方程组,它的系数矩阵是 n 阶方阵A\boldsymbol{A}。如果对应的行列式A|\boldsymbol{A}|不等于 0,即:

A=a11a1nan1ann0|\boldsymbol{A}|=\begin{vmatrix}a_{11}&\cdots&a_{1n}\\\vdots&&\vdots\\a_{n1}&\cdots&a_{nn}\end{vmatrix}\neq 0

则方程组有唯一解,并且解为:

x1=A1A,x2=A2A,...,xn=AnA\displaystyle x_1=\frac{|\boldsymbol{A}_1|}{|\boldsymbol{A}|},\quad x_2=\frac{|\boldsymbol{A}_2|}{|\boldsymbol{A}|},\quad...,\quad x_n=\frac{|\boldsymbol{A}_n|}{|\boldsymbol{A}|}

其中Aj(j=1,2,...,n)\boldsymbol{A}_j(j=1,2,...,n)是把系数矩阵A\boldsymbol{A}中第 j 列的元素用方程组右端的常数项代替后所得到的 n 阶矩阵,即:

Aj=(a11a1,j1b1a1,j+1a1nan1an,j1bnan,j+1ann)\boldsymbol{A}_j=\begin{pmatrix} a_{11}&\cdots&a_{1,j-1}&{\color{red}{b_1}}&a_{1,j+1}&\cdots&a_{1n}\\ \vdots&&\vdots&{\color{red}{\vdots}}&\vdots&&\vdots\\ a_{n1}&\cdots&a_{n,j-1}&{\color{red}{b_n}}&a_{n,j+1}&\cdots&a_{nn} \end{pmatrix}

这就是克拉默法则(Cramer’s Rule),也称为克莱姆法则。

相似矩阵

基变换

已知两个基m1,m2,,ms\boldsymbol{m_1},\boldsymbol{m_2},\ldots,\boldsymbol{m_s}以及n1,n2,,ns\boldsymbol{n_1},\boldsymbol{n_2},\ldots,\boldsymbol{n_s},当且仅当它们是同一个向量空间的基时,那么存在唯一的矩阵 P,使得下式成立:

(n1,n2,,ns)=(m1,m2,,ms)P(\boldsymbol{n_1},\boldsymbol{n_2},\ldots,\boldsymbol{n_s})=(\boldsymbol{m_1},\boldsymbol{m_2},\ldots,\boldsymbol{m_s})P

该矩阵 P 称为由基m1,m2,,ms\boldsymbol{m_1},\boldsymbol{m_2},\ldots,\boldsymbol{m}_s到基n1,n2,,ns\boldsymbol{n_1},\boldsymbol{n_2},\ldots,\boldsymbol{n_s}的过渡矩阵(Transition matrix),而上述公式称为基变换公式(Change of basis formula)。

过渡矩阵是满秩矩阵。

坐标变换

已知PP为由基M={m1,m2,,ms}\mathcal{M}=\{\boldsymbol{m_1},\boldsymbol{m_2},\ldots,\boldsymbol{m}_s\}到基N={n1,n2,,ns}\mathcal{N}=\{\boldsymbol{n_1},\boldsymbol{n_2},\ldots,\boldsymbol{n_s}\}的过渡矩阵:

(n1,n2,,ns)=(m1,m2,,ms)P(\boldsymbol{n_1},\boldsymbol{n_2},\ldots,\boldsymbol{n_s})=(\boldsymbol{m_1},\boldsymbol{m_2},\ldots,\boldsymbol{m_s})P

又知向量x在基、mathcalM\boldsymbol{x}在基、mathcal{M}下的坐标为[x]M[\boldsymbol{x}]_\mathcal{M}以及在基N\mathcal{N}下的坐标为[x]N[\boldsymbol{x}]_\mathcal{N},则有坐标变换公式(Change of coordinates formula):

[x]N=P1[x]M,[x]M=P[x]N[\boldsymbol{x}]_\mathcal{N}= P^{-1}[\boldsymbol{x}]_\mathcal{M},\quad [\boldsymbol{x}]_\mathcal{M}= P[\boldsymbol{x}]_\mathcal{N}

基变换和坐标变换的区别在于,前者是右乘过渡矩阵PP,后者是左乘P1P^{-1}

相似矩阵

A,BA,B都是nn阶方阵,若有可逆矩阵PP,使得:

B=P1APB=P^{-1}AP

则称 P 为相似变换矩阵(Similarity transformation matrix),称 B 是 A 的相似矩阵(Similar matrix),记作:

ABA\simeq B

相似矩阵其实就是改变矩阵函数的基

相似矩阵的性质

ABA\simeq B,则:

AkBk,kZ+A^k\simeq B^k,\quad k\in\mathbb{Z}^+

ATBTA^\mathrm{T}\simeq B^\mathrm{T}

ABA\simeq B,且ABA、B可逆,则:

A1B1A^{-1}\simeq B^{-1}

ABA^*\simeq B^*

ABBCA\simeq B,B\simeq C,那么:

ACA\simeq C

特征值与特征向量

特征值与特征向量

定义

设 A 是 n 阶方阵,x\boldsymbol{x}为非零向量,若存在数λ\lambda使得下式成立:

Ax=λxA\boldsymbol{x}=\lambda\boldsymbol{x}

那么将数λ\lambda称为 A 的特征值(Eigenvalue),非零向量x\boldsymbol{x}称为AA的对应于λ\lambda的特征向量(Eigenvector)。

求解

求解步骤还是比较简单,就是通过解下列方程组来求出特征值和特征向量:

{AλI=0(AλI)x=0{λ=?x=?\begin{cases}|A-\lambda I| = 0\\\\ (A-\lambda I)\boldsymbol{x} = \boldsymbol{0} \end{cases}\Longrightarrow \begin{cases}\lambda = ? \\\\ \boldsymbol{x} = ?\end{cases}

更具体的步骤是,先通过第一个式子求出特征值:

AλI=0    λ1,λ2,,λi,λn|A-\lambda I| = 0\implies \lambda_1,\lambda_2,\cdots,\lambda_i,\cdots\lambda_n

然后将、lambda_i 代入 (A-\lambda I)\boldsymbol{x}=\boldsymbol{0}求出该线性方程组的解集:

(AλiI)x=0    x=?(A-\lambda_i I)\boldsymbol{x}=\boldsymbol{0}\implies \boldsymbol{x}=?

该解集必然为向量空间,因为其中都是特征值为、lambda_i 的特征向量(零向量除外),所以也称为特征值为λi\lambda_i的特征空间(Eigenspace)。

特征多项式与特征方程

假设:

A=(a11a12a1na21a22a2nan1an2ann)A=\begin{pmatrix}a_{11}& a_{12} & \cdots & a_{1 n} \\ a_{21} & a_{22}& \cdots & a_{2 n} \\ \vdots & \vdots & & \vdots \\ a_{n 1} & a_{n 2} & \cdots & a_{n n}\end{pmatrix}

那么AλI=0|A-\lambda I| = 0可以写作:

AλI=a11λa12a1na21a22λa2nan1an2annλ=0|A-\lambda I|=\begin{vmatrix} a_{11}-\lambda & a_{12} & \cdots & a_{1 n} \\ a_{21} & a_{22}-\lambda & \cdots & a_{2 n} \\ \vdots & \vdots & & \vdots \\ a_{n 1} & a_{n 2} & \cdots & a_{n n}-\lambda \end{vmatrix}=0

其中AλI|A-\lambda I|展开后就是关于特征值λ\lambda的多项式,所以称为特征多项式(Characteristic polynomial):

a11λa12a1na21a22λa2nan1an2annλAλI=c0λn+c1λn1++cn\underbrace{\left|\begin{array}{cccc}a_{11}-\lambda & a_{12} & \cdots & a_{1 n} \\ a_{21} & a_{22}-\lambda & \cdots & a_{2 n} \\ \vdots & \vdots & & \vdots \\ a_{n 1} & a_{n 2} & \cdots & a_{n n}-\lambda\end{array}\right|}_{|A-\lambda I|}=c_0\lambda^{n}+c_1\lambda^{n-1}+\cdots+c_n

进而AλI=0|A-\lambda I| = 0被称为特征方程(Characteristic equation)。

已知λ1,λ2,,λm\lambda_1,\lambda_2,\cdots,\lambda_mnn阶方阵AA相异的特征值,以及v1,v2,,vm\boldsymbol{v}_1,\boldsymbol{v}_2,\cdots,\boldsymbol{v}_mλ1,λ2,,λm\lambda_1,\lambda_2,\cdots,\lambda_m对应的特征向量,则向量组{v1,v2,,vm}\{\boldsymbol{v}_1,\boldsymbol{v}_2,\cdots,\boldsymbol{v}_m\}线性无关。

不同特征值的特征向量是线性无关的。

对角化

如果nn阶方阵AAnn个线性无关的特征向量p1,p2,,pn\boldsymbol{p_1},\boldsymbol{p_2},\cdots,\boldsymbol{p_n},那么如下矩阵:

P=(p1,p2,,pn)P=(\boldsymbol{p_1},\boldsymbol{p_2},\cdots,\boldsymbol{p_n})

可以使得:

A=PΛP1A=P\Lambda P^{-1}

其中Λ\Lambda为如下对角阵

Λ=(λ1λ2λn)\Lambda=\left(\begin{array}{llll}\lambda_{1} & & & \\ & \lambda_{2} & & \\ & & \ddots & \\ & & & \lambda_{n}\end{array}\right)

其中的λ1,λ2,,λn\lambda_1,\lambda_2,\cdots,\lambda_n为特征向量p1,p2,,pn\boldsymbol{p_1},\boldsymbol{p_2},\cdots,\boldsymbol{p_n}对应的特征值,该过程称为对角化(Diagonalizable)。

正交矩阵

已知p1,p2,,pr\boldsymbol{p}_1,\boldsymbol{p}_2,\cdots,\boldsymbol{p}_r是向量空间VV的一个基,如果两两正交,即满足:

pipj=0,ij\boldsymbol{p}_i\cdot\boldsymbol{p}_j=0,\quad i\ne j

那么称其为正交基(Orthogonal basis)。如果还满足长度均为 1,即:

p1p1=p2p2==prpr=1\boldsymbol{p}_1\cdot\boldsymbol{p}_1=\boldsymbol{p}_2\cdot\boldsymbol{p}_2=\cdots=\boldsymbol{p}_r\cdot\boldsymbol{p}_r=1

那么,就称为标准正交基(Orthonormal basis)。

假设p1,p2,,pn\boldsymbol{p}_1,\boldsymbol{p}_2,\cdots,\boldsymbol{p}_n是向量空间Rn\mathbb{R}^n的一个标准正交基,那么由它们构造的nn阶方阵PP也称为正交矩阵(Orthogonal Matrix):

P=(p1,p2,,pn)P=(\boldsymbol{p}_1,\boldsymbol{p_2},\cdots,\boldsymbol{p}_n)

该方阵 P 必然满足:

PTP=P1P=IP^\mathrm{T}P=P^{-1}P=I

PTP^\mathrm{T}就是PP的逆矩阵。

施密特正交化

如果x1,x2,xn\boldsymbol{x}_1,\boldsymbol{x_2},\cdots\boldsymbol{x_n}是某向量空间的基,那么通过下述方法就可以找到该向量空间的正交基v1,v2,vn\boldsymbol{v}_1,\boldsymbol{v_2},\cdots\boldsymbol{v_n},该方法被称为施密特正交化(Gram–Schmidt process):

x1,,xn施密特正交化{v1=x1v2=x2x2v1v1v1v1v3=x3x3v1v1v1v1x3v2v2v2v2vn=xnxnv1v1v1v1xnvn1vn1vn1vn1\boldsymbol{x_1},\cdots,\boldsymbol{x_n} \xrightarrow{\quad\text{施密特正交化}\quad} \begin{cases} \boldsymbol{v_1}=\boldsymbol{x_1}\\ \quad\\ \boldsymbol{v_2}=\boldsymbol{x_2}-\frac{\boldsymbol{x_2}\cdot\boldsymbol{v_1}}{\boldsymbol{v_1}\cdot\boldsymbol{v_1}}\boldsymbol{v_1}\\ \quad\\ \boldsymbol{v_3}=\boldsymbol{x_3}-\frac{\boldsymbol{x_3}\cdot\boldsymbol{v_1}}{\boldsymbol{v_1}\cdot\boldsymbol{v_1}}\boldsymbol{v_1}-\frac{\boldsymbol{x_3}\cdot\boldsymbol{v_2}}{\boldsymbol{v_2}\cdot\boldsymbol{v_2}}\boldsymbol{v_2}\\ \quad\\ \qquad\qquad\vdots\\ \\ \boldsymbol{v_n}=\boldsymbol{x_n}-\frac{\boldsymbol{x_n}\cdot\boldsymbol{v_1}}{\boldsymbol{v_1}\cdot\boldsymbol{v_1}}\boldsymbol{v_1}-\cdots-\frac{\boldsymbol{x_n}\cdot\boldsymbol{v_{n-1}}}{\boldsymbol{v_{n-1}}\cdot\boldsymbol{v_{n-1}}}\boldsymbol{v_{n-1}} \end{cases}

正交对角化

如果矩阵AA是对称阵,且其中的每一个元素都是实数,那么称之为实对称阵(Real symmetric matrices)。此时有如下性质:

λ1,λ2\lambda_1,\lambda_2是实对称阵 A 相异的特征值,p1,p2\boldsymbol{p}_1,\boldsymbol{p}_2λ1,λ2\lambda_1,\lambda_2对应的特征向量,则有p1\boldsymbol{p}_1p2\boldsymbol{p}_2正交,即:

p1p2=0\boldsymbol{p_1}\cdot\boldsymbol{p_2}=0

对于nn阶方阵AA,如果存在正交矩阵PP和对角阵Λ\Lambda使得:

A=PΛP1=PΛPTA=P\Lambda P^{-1}=P\Lambda P^\mathrm{T}

那么就称该方阵AA可正交对角化(Orthogonal diagonalizable)。

正交对角化是对角化的一种特殊情况,这里进行一下对比:

  • n 阶方阵 A 可对角化,当且仅当有 n 个线性无关的特征向量
  • n 阶方阵 A 可正交对角化,当且仅当有 n 个正交的特征向量,此时这 n 个特征向量必然也线性无关

可以证明 A 可正交对角化的充要条件是 A 为对称阵,即:

A 可正交对角化、iffA 是对称阵A\ 可正交对角化、iff A\ 是对称阵

相似矩阵中的不变量

如果 A 和 B 是相似矩阵,那么两者的特征值相同:

AB    A,B的特征值相同A\simeq B\implies A,B 的特征值相同

如果A\boldsymbol{A}B\boldsymbol{B}是相似矩阵,那么两者的行列式相同:

AB    A=B\boldsymbol{A}\simeq \boldsymbol{B}\implies |\boldsymbol{A}|=|\boldsymbol{B}|

对于nn阶方阵A\boldsymbol{A},其主对角线(从左上方至右下方的对角线)的元素之和称为迹(Trace),记作tr(A)tr(\boldsymbol{A})

参考文献

《马同学的线性代数》
感兴趣的可以购买他的课程,写的很好(强烈推荐)!!!