Deep Learning Chapter01:机器学习中线性代数
好久不见,大家好,我是北山啦。机器学习当中需要用到许多的数学知识,如今博主又要继续踏上深度学习的路程,所以现在在网上总结了相关的考研数学和机器学习中常见相关知识如下,希望对大家有所帮助。
线性代数
行列式
1.行列式按行(列)展开定理
(1) 设
A=(aij)n×n,则:
ai1Aj1+ai2Aj2+⋯+ainAjn={∣A∣,i=j0,i=j
或
a1iA1j+a2iA2j+⋯+aniAnj={∣A∣,i=j0,i=j即
AA∗=A∗A=∣A∣E,其中:
A∗=⎝⎜⎜⎜⎛A11A21…An1A12A22…An2…………A1nA2n…Ann⎠⎟⎟⎟⎞=(Aji)=(Aij)T
Dn=∣∣∣∣∣∣∣∣∣1x1…x1n−11x2…x2n−1…………1xn…xnn−1∣∣∣∣∣∣∣∣∣=∏1≤j<i≤n(xi−xj)
(2) 设
A,B为
n阶方阵,则
∣AB∣=∣A∣∣B∣=∣B∣∣A∣=∣BA∣,但
∣A±B∣=∣A∣±∣B∣不一定成立。
(3)
∣kA∣=kn∣A∣,
A为
n阶方阵。
(4) 设
A为
n阶方阵,
∣AT∣=∣A∣;∣A−1∣=∣A∣−1(若
A可逆),
∣A∗∣=∣A∣n−1
n≥2
(5)
∣∣∣∣∣AOOB∣∣∣∣∣=∣∣∣∣∣ACOB∣∣∣∣∣=∣∣∣∣∣AOCB∣∣∣∣∣=∣A∣∣B∣
,
A,B为方阵,但
∣∣∣∣∣OBn×nAm×mO∣∣∣∣∣=(−1)mn∣A∣∣B∣ 。
(6) 范德蒙行列式
Dn=∣∣∣∣∣∣∣∣∣1x1…x1n−11x2…x2n1…………1xn…xnn−1∣∣∣∣∣∣∣∣∣=∏1≤j<i≤n(xi−xj)
设
A是
n阶方阵,
λi(i=1,2⋯,n)是
A的
n个特征值,则
∣A∣=∏i=1nλi
矩阵
矩阵:
m×n个数
aij排成
m行
n列的表格
⎣⎢⎢⎢⎡a11a12⋯a1na21a22⋯a2n⋯⋯⋯⋯⋯am1am2⋯amn⎦⎥⎥⎥⎤ 称为矩阵,简记为
A,或者
(aij)m×n 。若
m=n,则称
A是
n阶矩阵或
n阶方阵。
矩阵的线性运算
1.矩阵的加法
设
A=(aij),B=(bij)是两个
m×n矩阵,则
m×n 矩阵
C=cij)=aij+bij称为矩阵
A与
B的和,记为
A+B=C 。
2.矩阵的数乘
设
A=(aij)是
m×n矩阵,
k是一个常数,则
m×n矩阵
(kaij)称为数
k与矩阵
A的数乘,记为
kA。
3.矩阵的乘法
设
A=(aij)是
m×n矩阵,
B=(bij)是
n×s矩阵,那么
m×s矩阵
C=(cij),其中
cij=ai1b1j+ai2b2j+⋯+ainbnj=∑k=1naikbkj称为
AB的乘积,记为
C=AB 。
4.
AT、
A−1、
A∗三者之间的关系
(1)
(AT)T=A,(AB)T=BTAT,(kA)T=kAT,(A±B)T=AT±BT
(2)
(A−1)−1=A,(AB)−1=B−1A−1,(kA)−1=k1A−1,
但
(A±B)−1=A−1±B−1不一定成立。
(3)
(A∗)∗=∣A∣n−2 A (n≥3),
(AB)∗=B∗A∗,
(kA)∗=kn−1A∗ (n≥2)
但
(A±B)∗=A∗±B∗不一定成立。
(4)
(A−1)T=(AT)−1, (A−1)∗=(AA∗)−1,(A∗)T=(AT)∗
5.有关
A∗的结论
(1)
AA∗=A∗A=∣A∣E
(2)
∣A∗∣=∣A∣n−1 (n≥2), (kA)∗=kn−1A∗, (A∗)∗=∣A∣n−2A(n≥3)
(3) 若
A可逆,则
A∗=∣A∣A−1,(A∗)∗=∣A∣1A
(4) 若
A为
n阶方阵,则:
r(A∗)=⎩⎪⎪⎨⎪⎪⎧n,r(A)=n1,r(A)=n−10,r(A)<n−1
6.有关
A−1的结论
A可逆
⇔AB=E;⇔∣A∣=0;⇔r(A)=n;
⇔A可以表示为初等矩阵的乘积;
⇔A;⇔Ax=0。
7.有关矩阵秩的结论
(1) 秩
r(A)=行秩=列秩;
(2)
r(Am×n)≤min(m,n);
(3)
A=0⇒r(A)≥1;
(4)
r(A±B)≤r(A)+r(B);
(5) 初等变换不改变矩阵的秩
(6)
r(A)+r(B)−n≤r(AB)≤min(r(A),r(B)),特别若
AB=O
则:
r(A)+r(B)≤n
(7) 若
A−1存在
⇒r(AB)=r(B); 若
B−1存在
⇒r(AB)=r(A);
若
r(Am×n)=n⇒r(AB)=r(B); 若
r(Am×s)=n⇒r(AB)=r(A)。
(8)
r(Am×s)=n⇔Ax=0只有零解
8.分块求逆公式
(AOOB)−1=(A−1OOB−1);
(AOCB)−1=(A−1O−A−1CB−1B−1);
(ACOB)−1=(A−1−B−1CA−1OB−1);
(OBAO)−1=(OA−1B−1O)
这里
A,
B均为可逆方阵。
向量
1.有关向量组的线性表示
(1)
α1,α2,⋯,αs线性相关
⇔至少有一个向量可以用其余向量线性表示。
(2)
α1,α2,⋯,αs线性无关,
α1,α2,⋯,αs,
β线性相关
⇔β可以由
α1,α2,⋯,αs唯一线性表示。
(3)
β可以由
α1,α2,⋯,αs线性表示
⇔r(α1,α2,⋯,αs)=r(α1,α2,⋯,αs,β) 。
2.有关向量组的线性相关性
(1)部分相关,整体相关;整体无关,部分无关.
(2) ①
n个
n维向量
α1,α2⋯αn线性无关
⇔∣[α1α2⋯αn]∣=0,
n个
n维向量
α1,α2⋯αn线性相关
⇔∣[α1,α2,⋯,αn]∣=0
。
②
n+1个
n维向量线性相关。
③ 若
α1,α2⋯αS线性无关,则添加分量后仍线性无关;或一组向量线性相关,去掉某些分量后仍线性相关。
3.有关向量组的线性表示
(1)
α1,α2,⋯,αs线性相关
⇔至少有一个向量可以用其余向量线性表示。
(2)
α1,α2,⋯,αs线性无关,
α1,α2,⋯,αs,
β线性相关
⇔β 可以由
α1,α2,⋯,αs唯一线性表示。
(3)
β可以由
α1,α2,⋯,αs线性表示
⇔r(α1,α2,⋯,αs)=r(α1,α2,⋯,αs,β)
4.向量组的秩与矩阵的秩之间的关系
设
r(Am×n)=r,则
A的秩
r(A)与
A的行列向量组的线性相关性关系为:
(1) 若
r(Am×n)=r=m,则
A的行向量组线性无关。
(2) 若
r(Am×n)=r<m,则
A的行向量组线性相关。
(3) 若
r(Am×n)=r=n,则
A的列向量组线性无关。
(4) 若
r(Am×n)=r<n,则
A的列向量组线性相关。
5.
n维向量空间的基变换公式及过渡矩阵
若
α1,α2,⋯,αn与
β1,β2,⋯,βn是向量空间
V的两组基,则基变换公式为:
(β1,β2,⋯,βn)=(α1,α2,⋯,αn)⎣⎢⎢⎢⎡c11c21⋯cn1c12c22⋯cn2⋯⋯⋯⋯c1nc2n⋯cnn⎦⎥⎥⎥⎤=(α1,α2,⋯,αn)C
其中
C是可逆矩阵,称为由基
α1,α2,⋯,αn到基
β1,β2,⋯,βn的过渡矩阵。
6.坐标变换公式
若向量
γ在基
α1,α2,⋯,αn与基
β1,β2,⋯,βn的坐标分别是
X=(x1,x2,⋯,xn)T,
Y=(y1,y2,⋯,yn)T 即:
γ=x1α1+x2α2+⋯+xnαn=y1β1+y2β2+⋯+ynβn,则向量坐标变换公式为
X=CY 或
Y=C−1X,其中
C是从基
α1,α2,⋯,αn到基
β1,β2,⋯,βn的过渡矩阵。
7.向量的内积
(α,β)=a1b1+a2b2+⋯+anbn=αTβ=βTα
8.Schmidt正交化
若
α1,α2,⋯,αs线性无关,则可构造
β1,β2,⋯,βs使其两两正交,且
βi仅是
α1,α2,⋯,αi的线性组合
(i=1,2,⋯,n),再把
βi单位化,记
γi=∣βi∣βi,则
γ1,γ2,⋯,γi是规范正交向量组。其中
β1=α1,
β2=α2−(β1,β1)(α2,β1)β1 ,
β3=α3−(β1,β1)(α3,β1)β1−(β2,β2)(α3,β2)β2 ,
…
βs=αs−(β1,β1)(αs,β1)β1−(β2,β2)(αs,β2)β2−⋯−(βs−1,βs−1)(αs,βs−1)βs−1
9.正交基及规范正交基
向量空间一组基中的向量如果两两正交,就称为正交基;若正交基中每个向量都是单位向量,就称其为规范正交基。
线性方程组
1.克莱姆法则
线性方程组
⎩⎪⎪⎪⎪⎨⎪⎪⎪⎪⎧a11x1+a12x2+⋯+a1nxn=b1a21x1+a22x2+⋯+a2nxn=b2⋯⋯⋯⋯⋯⋯⋯⋯⋯an1x1+an2x2+⋯+annxn=bn,如果系数行列式
D=∣A∣=0,则方程组有唯一解,
x1=DD1,x2=DD2,⋯,xn=DDn,其中
Dj是把
D中第
j列元素换成方程组右端的常数列所得的行列式。
2.
n阶矩阵
A可逆
⇔Ax=0只有零解。
⇔∀b,Ax=b总有唯一解,一般地,
r(Am×n)=n⇔Ax=0只有零解。
3.非奇次线性方程组有解的充分必要条件,线性方程组解的性质和解的结构
(1) 设
A为
m×n矩阵,若
r(Am×n)=m,则对
Ax=b而言必有
r(A)=r(A⋮b)=m,从而
Ax=b有解。
(2) 设
x1,x2,⋯xs为
Ax=b的解,则
k1x1+k2x2⋯+ksxs当
k1+k2+⋯+ks=1时仍为
Ax=b的解;但当
k1+k2+⋯+ks=0时,则为
Ax=0的解。特别
2x1+x2为
Ax=b的解;
2x3−(x1+x2)为
Ax=0的解。
(3) 非齐次线性方程组
Ax=b无解
⇔r(A)+1=r(A)⇔b不能由
A的列向量
α1,α2,⋯,αn线性表示。
4.奇次线性方程组的基础解系和通解,解空间,非奇次线性方程组的通解
(1) 齐次方程组
Ax=0恒有解(必有零解)。当有非零解时,由于解向量的任意线性组合仍是该齐次方程组的解向量,因此
Ax=0的全体解向量构成一个向量空间,称为该方程组的解空间,解空间的维数是
n−r(A),解空间的一组基称为齐次方程组的基础解系。
(2)
η1,η2,⋯,ηt是
Ax=0的基础解系,即:
-
η1,η2,⋯,ηt是
Ax=0的解;
-
η1,η2,⋯,ηt线性无关;
-
Ax=0的任一解都可以由
η1,η2,⋯,ηt线性表出.
k1η1+k2η2+⋯+ktηt是
Ax=0的通解,其中
k1,k2,⋯,kt是任意常数。
矩阵的特征值和特征向量
1.矩阵的特征值和特征向量的概念及性质
(1) 设
λ是
A的一个特征值,则
kA,aA+bE,A2,Am,f(A),AT,A−1,A∗有一个特征值分别为
kλ,aλ+b,λ2,λm,f(λ),λ,λ−1,λ∣A∣,且对应特征向量相同(
AT 例外)。
(2)若
λ1,λ2,⋯,λn为
A的
n个特征值,则
∑i=1nλi=∑i=1naii,∏i=1nλi=∣A∣ ,从而
∣A∣=0⇔A没有特征值。
(3)设
λ1,λ2,⋯,λs为
A的
s个特征值,对应特征向量为
α1,α2,⋯,αs,
若:
α=k1α1+k2α2+⋯+ksαs ,
则:
Anα=k1Anα1+k2Anα2+⋯+ksAnαs=k1λ1nα1+k2λ2nα2+⋯ksλsnαs 。
2.相似变换、相似矩阵的概念及性质
(1) 若
A∼B,则
-
AT∼BT,A−1∼B−1,,A∗∼B∗
-
∣A∣=∣B∣,∑i=1nAii=∑i=1nbii,r(A)=r(B)
-
∣λE−A∣=∣λE−B∣,对
∀λ成立
3.矩阵可相似对角化的充分必要条件
(1)设
A为
n阶方阵,则
A可对角化
⇔对每个
ki重根特征值
λi,有
n−r(λiE−A)=ki
(2) 设
A可对角化,则由
P−1AP=Λ,有
A=PΛP−1,从而
An=PΛnP−1
(3) 重要结论
-
若
A∼B,C∼D,则
[AOOC]∼[BOOD].
-
若
A∼B,则
f(A)∼f(B),∣f(A)∣∼∣f(B)∣,其中
f(A)为关于
n阶方阵
A的多项式。
-
若
A为可对角化矩阵,则其非零特征值的个数(重根重复计算)=秩(
A)
4.实对称矩阵的特征值、特征向量及相似对角阵
(1)相似矩阵:设
A,B为两个
n阶方阵,如果存在一个可逆矩阵
P,使得
B=P−1AP成立,则称矩阵
A与
B相似,记为
A∼B。
(2)相似矩阵的性质:如果
A∼B则有:
-
AT∼BT
-
A−1∼B−1 (若
A,
B均可逆)
-
Ak∼Bk (
k为正整数)
-
∣λE−A∣=∣λE−B∣,从而
A,B
有相同的特征值
-
∣A∣=∣B∣,从而
A,B同时可逆或者不可逆
-
秩
(A)=秩
(B),∣λE−A∣=∣λE−B∣,
A,B不一定相似
二次型
1.
n个变量
x1,x2,⋯,xn的二次齐次函数
f(x1,x2,⋯,xn)=∑i=1n∑j=1naijxiyj,其中
aij=aji(i,j=1,2,⋯,n),称为
n元二次型,简称二次型. 若令
x= ⎣⎢⎢⎢⎢⎡x1x1⋮xn⎦⎥⎥⎥⎥⎤,A=⎣⎢⎢⎢⎡a11a21⋯an1a12a22⋯an2⋯⋯⋯⋯a1na2n⋯ann⎦⎥⎥⎥⎤,这二次型
f可改写成矩阵向量形式
f=xTAx。其中
A称为二次型矩阵,因为
aij=aji(i,j=1,2,⋯,n),所以二次型矩阵均为对称矩阵,且二次型与对称矩阵一一对应,并把矩阵
A的秩称为二次型的秩。
2.惯性定理,二次型的标准形和规范形
(1) 惯性定理
对于任一二次型,不论选取怎样的合同变换使它化为仅含平方项的标准型,其正负惯性指数与所选变换无关,这就是所谓的惯性定理。
(2) 标准形
二次型
f=(x1,x2,⋯,xn)=xTAx经过合同变换
x=Cy化为
f=xTAx=yTCTAC
y=∑i=1rdiyi2称为
f(r≤n)的标准形。在一般的数域内,二次型的标准形不是唯一的,与所作的合同变换有关,但系数不为零的平方项的个数由
r(A)唯一确定。
(3) 规范形
任一实二次型
f都可经过合同变换化为规范形
f=z12+z22+⋯zp2−zp+12−⋯−zr2,其中
r为
A的秩,
p为正惯性指数,
r−p为负惯性指数,且规范型唯一。
3.用正交变换和配方法化二次型为标准形,二次型及其矩阵的正定性
设
A正定
⇒kA(k>0),AT,A−1,A∗正定;
∣A∣>0,
A可逆;
aii>0,且
∣Aii∣>0
A,
B正定
⇒A+B正定,但
AB,
BA不一定正定
A正定
⇔f(x)=xTAx>0,∀x=0
⇔A的各阶顺序主子式全大于零
⇔A的所有特征值大于零
⇔A的正惯性指数为
n
⇔存在可逆阵
P使
A=PTP
⇔存在正交矩阵
Q,使
QTAQ=Q−1AQ=⎝⎜⎜⎜⎛λ1⋱λn⎠⎟⎟⎟⎞,
其中
λi>0,i=1,2,⋯,n.正定
⇒kA(k>0),AT,A−1,A∗正定;
∣A∣>0,A可逆;
aii>0,且
∣Aii∣>0 。
到这里就结束了,如果对你有帮助,欢迎点赞关注评论,你的点赞对我很重要
评论(0)