线性代数

原图

向量空间

向量

n 个有序的数a1,a2,...,an所组成的数组称为n 维向量,这n个数称为该向量的n个分量,第i个数ai称为第i个分量。n维向量可写成一行,也可写成一列。分别称为行向量和列向量:

  • n 维列向量:

(a1a2an)

  • 与 n 维行向量:

(a1,a2,...,an)quad(a1a2an)

n也称为该向量的维数。

向量的基本运算法则

quad v+u=u+vu+v+w=u+(v+w)quad \分ku=uk  kmu=k(mu)k(u+v)=ku+kv  

线性组合

  • 向量组: 若干同维数的列向量(或者同维数的行向量)所组成的集合,叫做向量组。比如同维数 的向量a1,a2,...am,可 以组成向量组A,通常记作:

    A:a1,a2,...,amquadA={a1,a2,...,am}

  • 线性相关: 给定向量组A={a1,a2,...,am}和向量b,如果存在一组实数k1,k2,...km,使:

    b=k1a1+k2a2+...+kmam

    则称向量b能由向量组A 线性表示,或称向量 b是向量组A的线性组合。

  • 线性相关和线性无关: 给定向量组A={a1,a2,...,am},如果存在不全为零的实数k1,k2,...km,使:

    k1a1+k2a2+...+kmam=0

    则称向量组A是线性相关的,否则称它为线性无关。

向量空间

V为一向量组,如果V非空,且V对于向量的加法及数乘两种运算封闭,那么就称V为向量空间。

所谓封闭,是指在V中向量进行数乘和加减,其结果依然在V中。具体的说,就是:

  • aV,bV,则a+bV
  • aV,kR,则kaV

张成空间

张成空间的定义

某向量组A={v1,v2,...,vp},其所有线性组合构成的集合为向量空间,也称为向量组A的张成空间,记为span(v1,v2,...,vp),即:

span(v1,v2,...,vp)={k1v1+k2v2+...+kpvp,k1,2,...,pR}

也称span(v1,v2,...,vp)为向量组A所张成。

等价向量组

设有两个向量组A={a1,a2,...,am}B={b1,b2,...,bn},若向量组B中的每个向量都能由向量组A线性表示,则称向量组B能由向量组A线性表示。

若向量组A与向量组B能相互线性表示,则称这两个向量组等价,也可以说AB是等价向量组。

最大无关组

设有向量组A,如果在A中能选出r个向量a1,a2,...,ar满足:

  • 向量组A0={a1,a2,...,ar}线性无关。
  • 向量组A中任意r+1个向量(如果A中有r+1个向量的话)都线性相关,那么称向量组A0是向量组A的一个最大线性无关组,简称最大无关组。

向量组的秩

假设向量组A的最大无关组为: A0={a1,a2,,ar}

A0的向量个数r称为向量组A的秩,记做rank(A),有时也记作r(A)

向量空间的基

  • 基: 已知V为向量空间,如果其中的某向量组:

    A={a1,a2,...an}

    V的最大无关组,那么向量组A被称为向量空间 V的一个基。

  • 坐标: 假设A={a1,a2,...,an}是向量空间V的一个基,则V中每个向量x可唯一地表示为: x=k1a1+k2a2++knan 上式的系数可以组成向量: [x]A=(k1k2kn) 我们将其称为x在基A下的坐标向量,或者简称为x在基A下的坐标。

  • 维度: 假设向量空间V的基为: A={a1,a2,,ar}A的秩r称为该向量空间的维度,或者称Vr维向量空间。

数量积(点积)

点积的定义

向量x=(x1xn)y=(y1yn)的点积(dotproduct),或称内积(innerproduct),定义为:

xy=x1y1++xnyn=i=1nxiyi

点积还可以称为数量积或者标量积,这是因为两个向量通过点积运算之后的结果是数量(标量)。

点积的性质

quadab=baquad(ka)b=k(ba)quad(a+b)c=ac+bc

矩阵和矩阵运算

矩阵的定义

m×n个数aij(i=1,2,...m;j=1,2...n)排成的mn列的数表称为mn列矩阵Matrix,简称m×n矩阵。为表示这些数字是一个整体,总是加一个括弧,下面就表示了矩阵A

A=(a11a12...a1na21a22...a2n.........am1am2...amn)n}m

可以用aijai,j来表示该矩阵A的第ij列的数字,刚才的矩阵还可以简记为:

A=(aij)=(ai,j)

为了表示矩阵的行数和列数,m×n矩阵A也记作Am×n

高斯消元法

  • 行阶梯形矩阵: 非零矩阵若满足:

    • 非零行在零行(如果存在的话)的上面
    • 非零行最左边的首非零元素在上一行(如果存在的话)的首非零元素的右面

    所以称为行阶梯形矩阵(Row echelon form),非零行最左边的首非零元素称为主元(Pivot element)。

  • 对角矩阵: 若 n 阶方阵如下: Λn=(λ10...00λ2...0.........00...λn) 对角线以外的元素都是 0,这种方阵称为对角矩阵(Diagonal matrix),简称对角阵,也记作: Λn=diag(λ1,λ2,...,λn)

  • 单位阵: 如果 n 阶对角阵的对角线上的元素全为 1: In=(10...001...0.........00...1) 该对角阵称为 n 阶单位矩阵(Identity matrix),或者简称为单位阵。在国内教材中,单位阵一般用 E 表示。

  • 行最简形矩阵: 若 A 是行阶梯形矩阵,并且还满足:

    • 主元为 1
    • 除主元外,其所在列的其它元素均为 0

    则称 A 为行最简形矩阵(Reduced row echelon form).

  • 初等行变换和初等行矩阵: 完成高斯消元法只需要三种操作,这三种操作是作用在矩阵的行上的,所以又称为初等行变换(Elementary row operations)。在单位阵上应用这三种初等行变换一次得到的矩阵称为初等行矩阵(Elementary row matrix),也就是下列表格中最右的矩阵: quadquadquadrow-additiontransformationsr1=r1+kr2(1k0010001)row-multiplyingtransformationsr1=kr1(k0)(k00010001)row-switchingtransformationsr1r2(010100001)

    初等行矩阵乘上矩阵 A,就相当于在矩阵 A 上实施了对应的初等行变换。

矩阵的加法与乘法

两个矩阵的行数相等、列数也相等时,就称它们是同型矩阵。

  • 加法: 设有两个m×n矩阵A=(aij)B=(bij),那么矩阵AB的和记做A+B,规定为: A+B=(a11+b11a12+b12...a1n+b1na21+b21a22+b22...a2n+b2n.........am1+bm1am2+bm2...amn+bmn)

  • 矩阵加法运算规律: quadA+B=B+Aquad(A+B)+C=A+(B+C)

  • 矩阵数乘: 数k与矩阵A的乘积记作: kAquadAk 规定为: kA=Ak=(ka11ka12ka1nka21ka22ka2nkam1kam2kamn)

  • 数乘的运算规律: quad(λμ)A=λ(μA)quad(λ+μ)A=λA+μAλ(A+B)=λA+λB

  • 矩阵乘法的定义: 设A=(aij)是一个m×s矩阵,B=(bij)是一个s×n矩阵,那么规定AB的乘积是一个m×n矩阵C=(cij),其中: cij=aibj=ai1b1j+ai2b2j+...+aisbsj=k=1saikbkj(i=1,,m;j=1,,n) 并把乘积记作: C=AB

  • 矩阵乘法运算规律: quadquadquadλ(AB)=(λA)B=A(λB)lambdaquad(AB)C=A(BC)quadA(B+C)=AB+AC

矩阵的幂与转置

类似于xn称为x的幂运算,矩阵也有幂运算,也称为矩阵的幂: 设A是方阵,定义:

A1=A,A2=A1A1,,Ak+1=AkA1

其中 k 为正整数。

  • 矩阵的转置: 把矩阵A的行换成同序数的列,该操作称为矩阵的转置运算。转置运算后可以得到一个新矩阵,该矩阵称为 A 的转置矩阵,记作AT。或者用符号表示如下: A=(aij),AT=(aji)

  • 转置的性质: (AT)T=A (AB)=BA^ (AT)n=(An)T (A+B)=A+B^ $x$$y$ ^=() $$

  • 对称矩阵与反对称矩阵: 若: AT=A 则矩阵 A 称为对称矩阵。

    若: AT=A 则矩阵 A 称为反对称矩阵。

矩阵函数

其实,任给一个 RGB 都可以如上转为对应的YPrPb。为了表明这一点,我们用未知向量xy来替换常向量ab

(0.2990.5870.1140.50.4186880.0813120.1687360.3312640.5)A (RGB)x = (YPrPb)y

这样就得到了函数Ax=y,也称为矩阵函数,其输入为x,输出为y

矩阵函数的性质

quadquadquadλ(AB)=(λA)B=A(λB)lambdaquad(AB)C=A(BC)quadA(B+C)=AB+AC

矩阵的秩

行秩和列秩

列空间

矩阵 A 的列向量为:

A=(a11a12a1na21a22a2nam1am2amn)=(c1,c2,,cn)

包含所有列向量的向量组称为列向量组,即:

{c1,c2,,cn}

列向量组的张成空间称为列空间,记作colsp(A),即:

colsp(A)=span({c1,c2,,cn})=x1c1+x2c2++xncn,x1,2,,nR

列向量组的秩,也就是列空间的维度,称为列秩,即:

=rank(colsp(A))

如果列向量组线性无关,就称为列满秩。

行空间

矩阵 A 的行向量为:

A=(a11a12a1na21a22a2nam1am2amn)=(r1Tr2TrmT)

包含所有行向量的向量组称为行向量组,即:

{r1T,r2T,,rmT}

行向量组的张成空间称为行空间,记作rowsp(A),即:

rowsp(A)=span({r1T,r2T,,rmT})=x1r1T+x2r2T++xmrmT,x1,2,,mR

行向量组的秩,也就是行空间的维度,称为行秩,即:

=rank(rowsp(A))

如果行向量组线性无关,就称为行满秩。

  • 矩阵的秩的定义: 对于任意矩阵,始终有列秩等于行秩,所以统称为矩阵的秩,即: ==

    矩阵 A 的秩记作rank(A),有时也简写为r(A)

  • 秩的几何意义: 根据自然定义域下,矩阵函数的值域可知,在自然定义域下

    • 列向量矩阵函数Ax=y的值域的维度是列秩
    • 行向量矩阵函数xTA=yT的值域的维度是行秩

    因为行秩=列秩=秩,所以当在自然定义域下时,秩就是矩阵函数的值域的维度。下面来看几个例子。

  • 满秩: 如果某个矩阵,既是列满秩,又是行满秩,那么就称该矩阵为满秩矩阵,或者简称为满秩。满秩矩阵必为方阵。

  • 秩的性质:

    • 秩的取值范围: 0rank(Am×n)min(m,n)

    • 转置矩阵的秩: rank(A)=rank(AT)

    • 复合函数的秩: rank(AB)min(rank(A),rank(B))

    • 满秩矩阵复合的秩。假设 P、Q 为满秩矩阵,那么: rank(PA)=rank(AQ)=rank(PAQ)=rank(A)

    • 矩阵相加的秩。假设 A、B 为同型矩阵,那么: rank(A+B)rank(A)+rank(B)

逆矩阵

逆矩阵的定义

若存在两个n阶方阵AC,两者的乘积为n阶单位阵I

AC=IqquadCA=I

那么C就是A的逆矩阵,即有A1=C,且A1是唯一的。

如果可以通过一系列初等行矩阵Ei,将矩阵A变换成单位阵I,则A的逆矩阵就是这些初等行矩阵的乘积:

E1E2...EnA1A=I

逆矩阵的运算规律

A可逆,则A1也可逆,且:

(A1)1=A

A可逆,数λ0,则λA可逆,且:

(λA)1=1λA1

AB为同阶方阵且均可逆,则AB也可逆,且:

(AB)1=B1A1

A可逆,则AT也可逆,且:

(AT)1=(A1)T

线性方程组的求解

  • 解的存在性 对于线性方程组Ax=b,它的增广矩阵为B=(A | b),那么:

    • 有解,当且仅当rank(A)=rank(B)
    • 无解,当且仅当rank(A)<rank(B)

    行满秩矩阵一定有解

  • 解的个数判别法: 对于线性方程组Ax=b,它的增广矩阵为B=(A | b),如果Am×n的矩阵,那么:

    • 有唯一解,当且仅当rank(A)=rank(B)=n
    • 有无数解,当且仅当rank(A)=rank(B)<n

    满秩矩阵解有唯一解

行列式

行列式定义

二阶行列式

假设有二阶方阵A=(a11a12a21a22),那么刚才定义的运算规则称为该二阶方阵A对应的行列式|A|,也称为二阶行列式:

|A|=|a11a12a21a22|=a11a22a12a21

上述定义只要求A是方阵,不要求是满秩矩阵。

三阶行列式

假设有三阶方阵A=(a11a12a13a21a22a23a31a32a33),那么刚才定义的运算规则称为该三阶方阵A对应的行列式|A|,也称为三阶行列式:

|A|=|a11a12a13a21a22a23a31a32a33|=a11a22a33+a12a23a31+a13a21a32a11a23a32a12a21a33a13a22a31

上述定义也只要求、boldsymbol{A}是方阵,不要求是满秩矩阵。

全排列

把 n 个不同的元素排成一列,叫做这 n 个元素的全排列。

逆序数

在一个排列(也就是数列)中,如果一对数的前后位置与大小顺序相反,即前面的数大于后面的数,那么它们就称为一个逆序。一个排列中逆序的总数就称为该排列的逆序数。逆序数为奇数的排列称为奇排列,逆序数为偶数的排列称为偶排列。

行列式定义

对于n阶方阵A=(aij),其行列式定义为:

|A|=|aij|=|a11a12a1na21a22a2nan1an2ann|=(1)ta1p1a2p2anpn

其中,t为排列p1p2pn的逆序数,表示对1,2,,n的全排列p1p2pn求和。

向量积

向量积S投影到了各个平面:

Squad{SxoySyozSzox

将这些投影加起来就得到了向量积S

S=b×c=Sxoy+Syoz+Szox=|b1c1b2c2|e3+|b2c2b3c3|e1+|b3c3b1c1|e2=|b2c2b3c3|e1+|b3c3b1c1|e2+|b1c1b2c2|e3

为了方便记忆,上面的式子往往如下书写,这就是向量积的定义: b×c=|b2c2b3c3|e1|b1c1b3c3|e2+|b1c1b2c2|e3

子式和余子式

子式

m×n矩阵A中,任取 k 行与 k 列km,kn,位于这些行、列交叉处的k2个元素,不改变它们在A中所处的位置次序而得的 k 阶行列式,称为矩阵A的 k 阶子式(Minor)。

Am×n的矩阵,I是集合{1,...,m}的一个k元子集,J是集合{1,...,n}的一个k元子集,|A|I,JAk阶子式,其中抽取的 k 行的行号是 I 中所有元素,k列的列号是J中所有元素。那么:

  • 如果I=J,称|A|I,JboldsymbolAk阶主子式(Principal minor)。
  • 如果I=J={1,,k}所取的是左起前 k 列和上起前k行),称|A|I,JAk阶顺序主子式(Leading principal minor)。

设在矩阵A中有一个不等于 0 的 r 阶子式|Br|,且所有r+1阶子式(如果存在的话)全等于 0,那么|Br|称为矩阵A的最高阶非零子式,数 r 称为矩阵A的秩。(不适合求矩阵的秩,太麻烦)

余子式

在 n 阶行列式中,把aij所在的第 i 行和第 j 列划去后,留下来的 n-1 阶行列式叫做aij的余子式,记做Mij.

代数余子式

aij的余子式Mij的基础上,还可以定义Aij,称为aij的代数余子式: Aij=(1)i+jMij

总结

行列式的性质

  • 行列式转置: 对于 n 阶方阵A=(aij),有: |A|=|a11a12a1na21a22a2nan1an2ann|,|AT|=|a11a21an1a12a22an2a1na2nann|

    行列式|AT|称为行列式|A|的转 置行列式。可以证明: |A|=|AT|

  • 满秩、可逆与行列式: 对于方阵A有: |A|0A iffA 

  • 行列式的数乘: 行列式乘以 k 倍,等于某行(列)乘以 k,该性质也可以称为行列式的数乘: k|a11a12a1nan1an2ann|=|a11a12a1nkai1kai2kainan1an2ann|=|a11ka1ja1nka2jan1kanjann|

  • 行或列互换: 行列式中的行(列)互换后,行列式正负号发生改变: |ai1ai2ainaj1aj2ajn|=|aj1aj2ajnai1ai2ain|

  • 行列式的倍加: 将一行(列)的 k 倍加进另一行(列)里,行列式的值不变,该性质也可以称为行列式的倍加: |ai1ai2ainaj1aj2ajn|=|ai1ai2ainaj1+kai1aj2+kai2ajn+kain|

  • 行列式的加法: 在行列式中,某一行(列)的每个元素是两数之和,则此行列式可拆分为两个相加的行列式,该性质也可以称为行列式的加法: |a11a12a1nai1+bi1ai2+bi2ain+binan1an2ann|=|a11a12a1nai1ai2ainan1an2ann|+|a11a12a1nbi1bi2binan1an2ann|

  • 行列式的乘法: 对于同阶方阵A,B,有: |AB|=|A||B| 该性质又称为行列式的乘法。

  • 三角行列式的计算法: |A|=|a11a21a220an1an2ann|=a11a22ann

  • 三角分块行列式的计算法: 设有分块矩阵: A=(BOCD) 则有: |A|=|B||D| 该性质也称为三角分块行列式的计算法。

  • 拉普拉斯展开: n 阶方阵A=(aij)的行列式可以表示成关于该方阵A的某一行的各元素与其对应的代数余子式乘积之和,即: |A|=ai1Ai1+ai2Ai2+...+ainAin(i=1,2,...,n) 或表示成关于该方阵 A 的某一列的各元素与其对应的代数余子式乘积之和: |A|=a1jA1j+a2jA2j+...+anjAnj(j=1,2,...,n) 这种计算行列式的方法称为拉普拉斯展开(Laplace expansion)。

克拉默法则

有 n 个未知数,n 个方程所组成的线性方程组,它的系数矩阵是 n 阶方阵A。如果对应的行列式|A|不等于 0,即:

|A|=|a11a1nan1ann|0

则方程组有唯一解,并且解为:

x1=|A1||A|,x2=|A2||A|,...,xn=|An||A|

其中Aj(j=1,2,...,n)是把系数矩阵A中第 j 列的元素用方程组右端的常数项代替后所得到的 n 阶矩阵,即:

Aj=(a11a1,j1b1a1,j+1a1nan1an,j1bnan,j+1ann)

这就是克拉默法则(Cramer's Rule),也称为克莱姆法则。

相似矩阵

基变换

已知两个基m1,m2,,ms以及n1,n2,,ns,当且仅当它们是同一个向量空间的基时,那么存在唯一的矩阵 P,使得下式成立: (n1,n2,,ns)=(m1,m2,,ms)P 该矩阵 P 称为由基m1,m2,,ms到基n1,n2,,ns的过渡矩阵(Transition matrix),而上述公式称为基变换公式(Change of basis formula)。

过渡矩阵是满秩矩阵。

坐标变换

已知P为由基M={m1,m2,,ms}到基N={n1,n2,,ns}的过渡矩阵:

(n1,n2,,ns)=(m1,m2,,ms)P

又知向量xmathcalM下的坐标为[x]M以及在基N下的坐标为[x]N,则有坐标变换公式(Change of coordinates formula):

[x]N=P1[x]M,[x]M=P[x]N

基变换和坐标变换的区别在于,前者是右乘过渡矩阵P,后者是左乘P1

相似矩阵

A,B都是n阶方阵,若有可逆矩阵P,使得:

B=P1AP

则称 P 为相似变换矩阵(Similarity transformation matrix),称 B 是 A 的相似矩阵(Similar matrix),记作:

AB

相似矩阵其实就是改变矩阵函数的基

相似矩阵的性质

AB,则:

AkBk,kZ+

ATBT

AB,且AB可逆,则:

A1B1

AB

ABBC,那么:

AC

特征值与特征向量

特征值与特征向量

定义

设 A 是 n 阶方阵,x为非零向量,若存在数λ使得下式成立:

Ax=λx

那么将数λ称为 A 的特征值(Eigenvalue),非零向量x称为A的对应于λ的特征向量(Eigenvector)。

求解

求解步骤还是比较简单,就是通过解下列方程组来求出特征值和特征向量:

{|AλI|=0(AλI)x=0{λ=?x=?

更具体的步骤是,先通过第一个式子求出特征值:

|AλI|=0λ1,λ2,,λi,λn

然后将、lambda_i 代入 (A-I)=求出该线性方程组的解集:

(AλiI)x=0x=?

该解集必然为向量空间,因为其中都是特征值为、lambda_i 的特征向量(零向量除外),所以也称为特征值为λi的特征空间(Eigenspace)。

特征多项式与特征方程

假设: A=(a11a12a1na21a22a2nan1an2ann)

那么|AλI|=0可以写作:

|AλI|=|a11λa12a1na21a22λa2nan1an2annλ|=0

其中|AλI|展开后就是关于特征值λ的多项式,所以称为特征多项式(Characteristic polynomial):

|a11λa12a1na21a22λa2nan1an2annλ||AλI|=c0λn+c1λn1++cn

进而|AλI|=0被称为特征方程(Characteristic equation)。

已知λ1,λ2,,λmn阶方阵A相异的特征值,以及v1,v2,,vmλ1,λ2,,λm对应的特征向量,则向量组{v1,v2,,vm}线性无关。

不同特征值的特征向量是线性无关的。

对角化

如果n阶方阵An个线性无关的特征向量p1,p2,,pn,那么如下矩阵:

P=(p1,p2,,pn)

可以使得:

A=PΛP1

其中Λ为如下对角阵

Λ=(λ1λ2λn)

其中的λ1,λ2,,λn为特征向量p1,p2,,pn对应的特征值,该过程称为对角化(Diagonalizable)。

正交矩阵

已知p1,p2,,pr是向量空间V的一个基,如果两两正交,即满足:

pipj=0,ij

那么称其为正交基(Orthogonal basis)。如果还满足长度均为 1,即:

p1p1=p2p2==prpr=1

那么,就称为标准正交基(Orthonormal basis)。

假设p1,p2,,pn是向量空间Rn的一个标准正交基,那么由它们构造的n阶方阵P也称为正交矩阵(Orthogonal Matrix):

P=(p1,p2,,pn)

该方阵 P 必然满足:

PTP=P1P=I

PT就是P的逆矩阵。

施密特正交化

如果x1,x2,xn是某向量空间的基,那么通过下述方法就可以找到该向量空间的正交基v1,v2,vn,该方法被称为施密特正交化(Gram–Schmidt process):

x1,,xn施密特正交化{v1=x1v2=x2x2v1v1v1v1v3=x3x3v1v1v1v1x3v2v2v2v2vn=xnxnv1v1v1v1xnvn1vn1vn1vn1

正交对角化

如果矩阵A是对称阵,且其中的每一个元素都是实数,那么称之为实对称阵(Real symmetric matrices)。此时有如下性质:

λ1,λ2是实对称阵 A 相异的特征值,p1,p2λ1,λ2对应的特征向量,则有p1p2正交,即:

p1p2=0

对于n阶方阵A,如果存在正交矩阵P和对角阵Λ使得:

A=PΛP1=PΛPT

那么就称该方阵A可正交对角化(Orthogonal diagonalizable)。

正交对角化是对角化的一种特殊情况,这里进行一下对比:

  • n 阶方阵 A 可对角化,当且仅当有 n 个线性无关的特征向量
  • n 阶方阵 A 可正交对角化,当且仅当有 n 个正交的特征向量,此时这 n 个特征向量必然也线性无关

可以证明 A 可正交对角化的充要条件是 A 为对称阵,即: A iffA 

相似矩阵中的不变量

如果 A 和 B 是相似矩阵,那么两者的特征值相同:

ABA,B

如果AB是相似矩阵,那么两者的行列式相同:

AB|A|=|B|

对于n阶方阵A,其主对角线(从左上方至右下方的对角线)的元素之和称为迹(Trace),记作tr(A)

参考文献

《马同学的线性代数》
感兴趣的可以购买他的课程,写的很好(强烈推荐)!!!