汽车雷达在多径存在下的幽灵目标检测
D. Sharif, S. Murtala and G. S. Choi, “A Survey of Automotive Radar Misalignment Detection Techniques,” in IEEE Access, vol. 13, pp. 123314-123324, 2025, doi: 10.1109/ACCESS.2025.3584454.
摘要
共置多输入多输出(MIMO)技术已被广泛应用于汽车雷达系统,因为它能够以相对较少的发射和接收天线数量提供精确的角度估计。由于视距目标的发射方向(DOD)和到达方向(DOA)重合,MIMO信号处理允许形成更大的虚拟阵列用于角度查找。然而,多径反射是一个主要的限制因素,雷达信号可能从障碍物反弹,创建DOD不等于DOA的回波。因此,在具有多个散射体的复杂场景中,目标的直接路径可能被其他物体的间接路径破坏,导致不准确的角度估计或产生幽灵目标。
本文将多径反射引起的幽灵存在检测作为一个复合假设决策问题:H 0 H_0 H 0 假设观测仅包含共享相同(未知)DOD和DOA的未知数量直接路径;H 1 H_1 H 1 假设观测还包含DOD和DOA不重合的未知数量间接路径。我们采用广义似然比检验(GLRT)哲学来确定检测器结构,提供理论检测性能的闭式表达式,以及改善检测性能的凸波形优化方法。在实际场景中,GLRT哲学的未知参数被精心设计的估计器替代。直接路径和多径的角度通过稀疏增强的压缩感知(CS)方法与Levenberg-Marquardt(LM)优化进行估计,以在连续域中估计角度参数。
1. 引言
近年来,对更安全驾驶的需求导致了汽车雷达的显著需求增长。共置MIMO技术已被证明能够有效地以相对较少的天线数量提供精确的物体角度估计,使其在汽车行业中广受欢迎。
共置MIMO系统的一个主要挑战是多径反射,其中目标回波通过多条路径到达接收器,包括直接和间接路径。直接路径涉及信号从雷达传输到目标,然后直接反射回雷达,而间接路径可能在反射器之间多次反弹。通常,由于不同的传播延迟,距离门控可以消除我们试图检测的目标的间接路径。然而,某些间接路径的信号DOD不等于DOA,因此共置MIMO的假设不成立。结果是,在多目标场景中,意图目标的直接路径可能被其他物体的间接路径破坏,应用经典角度查找算法可能导致角度估计精度下降和检测到幽灵目标。
为了检测幽灵目标,一些研究者利用延迟-多普勒域中检测的几何关系。具体来说,R. Feng等人采用霍夫变换来探索多径检测的线性关系。F. Ross等人通过分析移动目标的多普勒分布来检测幽灵目标。这些方法在幽灵目标速度显著时可能有效,有效利用多普勒信息可以帮助从多径中提取几何信息进行识别。值得注意的是,文献[15]的作者提出了一种通过波形设计抑制幽灵的新方法,该方法有效地以高精度控制不同延迟-多普勒单元的响应。
2. 信号模型和问题形式化
最先进的汽车雷达通常采用调频连续波(FMCW)序列来实现高分辨率的目标距离和径向速度估计,并采用共置MIMO技术来合成大的虚拟阵列以进行精确的角度估计。我们考虑一个共置MIMO雷达系统,具有M T M_T M T 个发射天线发射同样多的编码序列和M R M_R M R 个接收天线。在接收端,每个天线的信号经过通常的处理以提取每个发射天线的贡献,并合成具有M T M R M_T M_R M T M R 个元素的MIMO通道。然后通过沿快时间和慢时间的快速傅里叶变换(FFT)处理该信号,以获得回波的延迟-多普勒轮廓。最后,可以构建检测目标的虚拟阵列响应以估计目标的方向。
2.1 多径场景可视化
图1描述 :图1展示了多径场景的可视化。图1(a)显示了直接路径,其中雷达信号直接传输到位于位置A的目标并直接反射回来,发射和到达角度相等。图1(b)显示了一对一阶路径,其中信号在到达目标之前或从目标返回时在位于点B的反射器处反弹一次,导致DOD和DOA不相等。
多径场景可以可视化为雷达发射信号从目标和反射器反弹。如图1所示,目标位于位置A,反射器位于点B,雷达接收的信号可以采取不同的路径:
直接路径 :雷达和目标之间的最短路径,直接路径的发射和到达角度等于目标角度,如图1(a)所示。
一阶路径 :间接路径涉及在发射或到达途中在反射器处的单次反弹,导致比直接路径更长的延迟。如图1(b)所示,一阶路径的DOD不等于相应的DOA。
高阶路径 :间接路径在回波到达接收器之前涉及更多反弹。然而,由于目标和反射器处散射引起的衰减,高阶路径通常很弱,可以忽略。
2.2 信号模型
考虑一个FMCW MIMO雷达,从每个发射天线传输L L L 个脉冲,并采用慢时编码作为复用方法。令x ( l ) = [ x 1 ( l ) , x 2 ( l ) , ⋯ , x M T ( l ) ] T \mathbf{x}(l) = [x_1(l), x_2(l), \cdots, x_{M_T}(l)]^T x ( l ) = [ x 1 ( l ) , x 2 ( l ) , ⋯ , x M T ( l ) ] T 为第l l l 个时期M T M_T M T 个发射天线传输的码矢量,传输码矩阵可以表示为X = [ x ( 1 ) , x ( 2 ) , ⋯ , x ( L ) ] ∈ C M T × L \mathbf{X} = [\mathbf{x}(1), \mathbf{x}(2), \cdots, \mathbf{x}(L)] \in \mathbb{C}^{M_T \times L} X = [ x ( 1 ) , x ( 2 ) , ⋯ , x ( L ) ] ∈ C M T × L 。
在对接收测量的快时间执行FFT后,我们在给定的被测延迟单元中考虑K 0 K_0 K 0 个直接路径和K 1 K_1 K 1 对一阶路径,将观测y ( l ) ∈ C M R × 1 \mathbf{y}(l) \in \mathbb{C}^{M_R \times 1} y ( l ) ∈ C M R × 1 建模为:
y ( l ) = ∑ k = 1 K 0 α k e j 2 π f d ( l − 1 ) a R ( θ k ) a T T ( θ k ) x ( l ) \mathbf{y}(l) = \sum_{k=1}^{K_0} \alpha_k e^{j2\pi f_d(l-1)} \mathbf{a}_R(\theta_k)\mathbf{a}_T^T(\theta_k)\mathbf{x}(l)
y ( l ) = k = 1 ∑ K 0 α k e j 2 π f d ( l − 1 ) a R ( θ k ) a T T ( θ k ) x ( l )
+ ∑ k = 1 K 1 β k , 1 e j 2 π f d ( l − 1 ) a R ( ϕ k ) a T T ( ϑ k ) x ( l ) + \sum_{k=1}^{K_1} \beta_{k,1} e^{j2\pi f_d(l-1)} \mathbf{a}_R(\phi_k)\mathbf{a}_T^T(\vartheta_k)\mathbf{x}(l)
+ k = 1 ∑ K 1 β k , 1 e j 2 π f d ( l − 1 ) a R ( ϕ k ) a T T ( ϑ k ) x ( l )
+ ∑ k = 1 K 1 β k , 2 e j 2 π f d ( l − 1 ) a R ( ϑ k ) a T T ( ϕ k ) x ( l ) + w ( l ) + \sum_{k=1}^{K_1} \beta_{k,2} e^{j2\pi f_d(l-1)} \mathbf{a}_R(\vartheta_k)\mathbf{a}_T^T(\phi_k)\mathbf{x}(l) + \mathbf{w}(l)
+ k = 1 ∑ K 1 β k , 2 e j 2 π f d ( l − 1 ) a R ( ϑ k ) a T T ( ϕ k ) x ( l ) + w ( l )
其中:
α k \alpha_k α k 、β k , 1 \beta_{k,1} β k , 1 和β k , 2 \beta_{k,2} β k , 2 分别表示第k k k 个直接路径(k = 1 , 2 , … , K 0 k = 1, 2, \ldots, K_0 k = 1 , 2 , … , K 0 )和第k k k 对一阶路径(k = 1 , 2 , … , K 1 k = 1, 2, \ldots, K_1 k = 1 , 2 , … , K 1 )的复振幅
θ k \theta_k θ k 表示第k k k 个直接路径的DOD,等于DOA
ϑ k \vartheta_k ϑ k 和ϕ k \phi_k ϕ k 表示第k k k 对一阶路径的DOD和DOA,其中ϑ k ≠ ϕ k \vartheta_k \neq \phi_k ϑ k = ϕ k
f d f_d f d 是归一化多普勒频率
a T ( ⋅ ) ∈ C M T × 1 \mathbf{a}_T(\cdot) \in \mathbb{C}^{M_T \times 1} a T ( ⋅ ) ∈ C M T × 1 和a R ( ⋅ ) ∈ C M R × 1 \mathbf{a}_R(\cdot) \in \mathbb{C}^{M_R \times 1} a R ( ⋅ ) ∈ C M R × 1 是导向矢量
导向矢量具体定义为:
a T ( θ ) = 1 M T [ e j 2 π d T , 1 sin ( θ ) / λ , e j 2 π d T , 2 sin ( θ ) / λ , … , e j 2 π d T , M T sin ( θ ) / λ ] T \mathbf{a}_T(\theta) = \frac{1}{\sqrt{M_T}}\left[e^{j2\pi d_{T,1}\sin(\theta)/\lambda}, e^{j2\pi d_{T,2}\sin(\theta)/\lambda}, \ldots, e^{j2\pi d_{T,M_T}\sin(\theta)/\lambda}\right]^T
a T ( θ ) = M T 1 [ e j 2 π d T , 1 s i n ( θ ) / λ , e j 2 π d T , 2 s i n ( θ ) / λ , … , e j 2 π d T , M T s i n ( θ ) / λ ] T
a R ( ϕ ) = 1 M R [ e j 2 π d R , 1 sin ( ϕ ) / λ , e j 2 π d R , 2 sin ( ϕ ) / λ , … , e j 2 π d R , M R sin ( ϕ ) / λ ] T \mathbf{a}_R(\phi) = \frac{1}{\sqrt{M_R}}\left[e^{j2\pi d_{R,1}\sin(\phi)/\lambda}, e^{j2\pi d_{R,2}\sin(\phi)/\lambda}, \ldots, e^{j2\pi d_{R,M_R}\sin(\phi)/\lambda}\right]^T
a R ( ϕ ) = M R 1 [ e j 2 π d R , 1 s i n ( ϕ ) / λ , e j 2 π d R , 2 s i n ( ϕ ) / λ , … , e j 2 π d R , M R s i n ( ϕ ) / λ ] T
其中θ \theta θ 和ϕ \phi ϕ 分别表示a T ( ⋅ ) \mathbf{a}_T(\cdot) a T ( ⋅ ) 和a R ( ⋅ ) \mathbf{a}_R(\cdot) a R ( ⋅ ) 的角度,λ \lambda λ 表示波长,d T , m d_{T,m} d T , m 和d R , n d_{R,n} d R , n 表示第m m m 个TX元素和第n n n 个RX元素相对于参考阵列元素的相对距离。
定义P ( f d ) = diag ( [ 1 , e j 2 π f d , ⋯ , e j 2 π f d ( L − 1 ) ] ) \mathbf{P}(f_d) = \text{diag}([1, e^{j2\pi f_d}, \cdots, e^{j2\pi f_d(L-1)}]) P ( f d ) = diag ( [ 1 , e j 2 π f d , ⋯ , e j 2 π f d ( L − 1 ) ] ) ,接收数据矩阵为:
Y = ∑ k = 1 K 0 α k a R ( θ k ) a T T ( θ k ) X P ( f d ) + ∑ k = 1 K 1 β k , 1 a R ( ϕ k ) a T T ( ϑ k ) X P ( f d ) \mathbf{Y} = \sum_{k=1}^{K_0} \alpha_k \mathbf{a}_R(\theta_k)\mathbf{a}_T^T(\theta_k)\mathbf{X}\mathbf{P}(f_d) + \sum_{k=1}^{K_1} \beta_{k,1} \mathbf{a}_R(\phi_k)\mathbf{a}_T^T(\vartheta_k)\mathbf{X}\mathbf{P}(f_d)
Y = k = 1 ∑ K 0 α k a R ( θ k ) a T T ( θ k ) X P ( f d ) + k = 1 ∑ K 1 β k , 1 a R ( ϕ k ) a T T ( ϑ k ) X P ( f d )
+ ∑ k = 1 K 1 β k , 2 a R ( ϑ k ) a T T ( ϕ k ) X P ( f d ) + W + \sum_{k=1}^{K_1} \beta_{k,2} \mathbf{a}_R(\vartheta_k)\mathbf{a}_T^T(\phi_k)\mathbf{X}\mathbf{P}(f_d) + \mathbf{W}
+ k = 1 ∑ K 1 β k , 2 a R ( ϑ k ) a T T ( ϕ k ) X P ( f d ) + W
经过匹配滤波Z = Y ( X P ( f d ) ) H \mathbf{Z} = \mathbf{Y}(\mathbf{X}\mathbf{P}(f_d))^H Z = Y ( X P ( f d ) ) H 并向量化后,虚拟MIMO阵列信号的一般模型为:
z = ( R x ⊗ I M R ) A ( Θ , Φ ) β + r \mathbf{z} = (\mathbf{R}_x \otimes \mathbf{I}_{M_R})\mathbf{A}(\boldsymbol{\Theta}, \boldsymbol{\Phi})\boldsymbol{\beta} + \mathbf{r}
z = ( R x ⊗ I M R ) A ( Θ , Φ ) β + r
其中R x = X ∗ X T \mathbf{R}_x = \mathbf{X}^*\mathbf{X}^T R x = X ∗ X T ,A ( Θ , Φ ) = A T ( Θ ) ∘ A R ( Φ ) \mathbf{A}(\boldsymbol{\Theta}, \boldsymbol{\Phi}) = \mathbf{A}_T(\boldsymbol{\Theta}) \circ \mathbf{A}_R(\boldsymbol{\Phi}) A ( Θ , Φ ) = A T ( Θ ) ∘ A R ( Φ ) 表示响应矩阵。
3. 多径检测
3.1 GLRT检测器
在前一节概述的一般设置中,幽灵检测相当于解决一个耦合的检测-估计问题,其中我们必须区分复合假设H 0 H_0 H 0 (观测仅包含来自未知不同方向的未知数量K 0 K_0 K 0 个直接路径)与复合替代假设H 1 H_1 H 1 (观测还包含未知数量K 1 K_1 K 1 个一阶路径,每个由未知角度对表征)。
假设首先矩阵已知,我们需要解决复合二元假设检验:
{ H 0 : z = ( R x ⊗ I M R ) A ( Θ 0 ) α + r H 1 : z = ( R x ⊗ I M R ) A ( Θ , Φ ) β + r \begin{cases}
H_0: \mathbf{z} = (\mathbf{R}_x \otimes \mathbf{I}_{M_R})\mathbf{A}(\boldsymbol{\Theta}_0)\boldsymbol{\alpha} + \mathbf{r} \\
H_1: \mathbf{z} = (\mathbf{R}_x \otimes \mathbf{I}_{M_R})\mathbf{A}(\boldsymbol{\Theta}, \boldsymbol{\Phi})\boldsymbol{\beta} + \mathbf{r}
\end{cases} { H 0 : z = ( R x ⊗ I M R ) A ( Θ 0 ) α + r H 1 : z = ( R x ⊗ I M R ) A ( Θ , Φ ) β + r
其中α ∈ C K 0 × 1 \boldsymbol{\alpha} \in \mathbb{C}^{K_0 \times 1} α ∈ C K 0 × 1 和β ∈ C ( K 0 + 2 K 1 ) × 1 \boldsymbol{\beta} \in \mathbb{C}^{(K_0+2K_1) \times 1} β ∈ C ( K 0 + 2 K 1 ) × 1 是未知参数。
由于E ( r r H ) = σ 2 R x ⊗ I M R \mathbb{E}(\mathbf{r}\mathbf{r}^H) = \sigma^2\mathbf{R}_x \otimes \mathbf{I}_{M_R} E ( r r H ) = σ 2 R x ⊗ I M R ,我们有r ∼ C N ( 0 , σ 2 Σ x ) \mathbf{r} \sim \mathcal{CN}(0, \sigma^2\boldsymbol{\Sigma}_x) r ∼ C N ( 0 , σ 2 Σ x ) ,其中Σ x = R x ⊗ I M R \boldsymbol{\Sigma}_x = \mathbf{R}_x \otimes \mathbf{I}_{M_R} Σ x = R x ⊗ I M R 。通过噪声白化变换,测试变为:
{ H 0 : z ˉ ∼ C N ( Σ x 1 / 2 A ( Θ 0 ) α , σ 2 I M T M R ) H 1 : z ˉ ∼ C N ( Σ x 1 / 2 A ( Θ , Φ ) β , σ 2 I M T M R ) \begin{cases}
H_0: \bar{\mathbf{z}} \sim \mathcal{CN}(\boldsymbol{\Sigma}_x^{1/2}\mathbf{A}(\boldsymbol{\Theta}_0)\boldsymbol{\alpha}, \sigma^2\mathbf{I}_{M_T M_R}) \\
H_1: \bar{\mathbf{z}} \sim \mathcal{CN}(\boldsymbol{\Sigma}_x^{1/2}\mathbf{A}(\boldsymbol{\Theta}, \boldsymbol{\Phi})\boldsymbol{\beta}, \sigma^2\mathbf{I}_{M_T M_R})
\end{cases} { H 0 : z ˉ ∼ C N ( Σ x 1 / 2 A ( Θ 0 ) α , σ 2 I M T M R ) H 1 : z ˉ ∼ C N ( Σ x 1 / 2 A ( Θ , Φ ) β , σ 2 I M T M R )
其中z ˉ = Σ x − 1 / 2 z \bar{\mathbf{z}} = \boldsymbol{\Sigma}_x^{-1/2}\mathbf{z} z ˉ = Σ x − 1 / 2 z 。GLRT为:
T G L R T = ∥ P ( Θ 0 ) z ˉ ∥ 2 ∥ P ( Θ , Φ ) z ˉ ∥ 2 ≷ H 1 H 0 λ G T_{GLRT} = \frac{\|\mathbf{P}(\boldsymbol{\Theta}_0)\bar{\mathbf{z}}\|^2}{\|\mathbf{P}(\boldsymbol{\Theta}, \boldsymbol{\Phi})\bar{\mathbf{z}}\|^2} \underset{H_0}{\overset{H_1}{\gtrless}} \lambda_G
T G L R T = ∥ P ( Θ , Φ ) z ˉ ∥ 2 ∥ P ( Θ 0 ) z ˉ ∥ 2 H 0 ≷ H 1 λ G
其中P ( Θ 0 ) \mathbf{P}(\boldsymbol{\Theta}_0) P ( Θ 0 ) 和P ( Θ , Φ ) \mathbf{P}(\boldsymbol{\Theta}, \boldsymbol{\Phi}) P ( Θ , Φ ) 是相应的正交投影矩阵。
3.2 性能界限和波形优化
图2描述 :图2显示了虚警概率P f a P_{fa} P f a 与检测阈值λ G \lambda_G λ G 的关系,针对M T M R = 48 M_T M_R = 48 M T M R = 4 8 的不同( K 0 , K 1 ) (K_0, K_1) ( K 0 , K 1 ) 值。可以观察到,随着K 1 K_1 K 1 增加,给定阈值下的虚警概率降低,这是因为假设之间的可区分性增加。
在H 0 H_0 H 0 下,测试统计量比率X X X 具有Fisher-Snedecor分布,密度为:
f X ∣ H 0 ( x ) = 1 B ( 2 K 1 ; m ) x 2 K 1 − 1 ( 1 + x ) − ( m + 2 K 1 ) f_{X|H_0}(x) = \frac{1}{B(2K_1; m)} x^{2K_1-1}(1 + x)^{-(m+2K_1)}
f X ∣ H 0 ( x ) = B ( 2 K 1 ; m ) 1 x 2 K 1 − 1 ( 1 + x ) − ( m + 2 K 1 )
其中m = M T M R − K 0 − 2 K 1 m = M_T M_R - K_0 - 2K_1 m = M T M R − K 0 − 2 K 1 ,B ( a ; b ) B(a; b) B ( a ; b ) 表示参数为a a a 和b b b 的贝塔函数。
虚警概率和检测概率的闭式表达式为:
P f a = 1 − 1 B ( 2 K 1 ; m ) ∑ i = 0 m − 1 ( − 1 ) i ( m − 1 i ) 2 K 1 + i ( 1 − 1 / λ G ) 2 K 1 + i P_{fa} = 1 - \frac{1}{B(2K_1; m)} \sum_{i=0}^{m-1} (-1)^i \binom{m-1}{i} \frac{2K_1 + i}{(1 - 1/\lambda_G)^{2K_1+i}}
P f a = 1 − B ( 2 K 1 ; m ) 1 i = 0 ∑ m − 1 ( − 1 ) i ( i m − 1 ) ( 1 − 1 / λ G ) 2 K 1 + i 2 K 1 + i
P d = 1 − 1 B ( 2 K 1 ; m ) ∑ i = 0 m − 1 ( − 1 ) i ( m − 1 i ) 2 K 1 + i ( λ G − 1 λ G + ρ 1 ) 2 K 1 + i P_d = 1 - \frac{1}{B(2K_1; m)} \sum_{i=0}^{m-1} (-1)^i \binom{m-1}{i} \frac{2K_1 + i}{\left(\frac{\lambda_G - 1}{\lambda_G + \rho_1}\right)^{2K_1+i}}
P d = 1 − B ( 2 K 1 ; m ) 1 i = 0 ∑ m − 1 ( − 1 ) i ( i m − 1 ) ( λ G + ρ 1 λ G − 1 ) 2 K 1 + i 2 K 1 + i
其中ρ 1 \rho_1 ρ 1 是一个适合的品质因数,定义为:
ρ 1 = σ β 2 2 K 1 σ 2 Tr ( E H Σ x 1 / 2 P 0 Σ x 1 / 2 E ) \rho_1 = \frac{\sigma_\beta^2}{2K_1\sigma^2} \text{Tr}\left(\mathbf{E}^H\boldsymbol{\Sigma}_x^{1/2}\mathbf{P}_0\boldsymbol{\Sigma}_x^{1/2}\mathbf{E}\right)
ρ 1 = 2 K 1 σ 2 σ β 2 Tr ( E H Σ x 1 / 2 P 0 Σ x 1 / 2 E )
图3描述 :图3展示了检测概率P d P_d P d 与σ β 2 / σ 2 \sigma_\beta^2/\sigma^2 σ β 2 / σ 2 的关系,比较了正交波形和优化波形的性能。可以看到,通过波形优化可以显著提高检测性能,特别是在低SNR条件下。
波形优化问题可以形式化为以下凸优化问题:
\begin{align}
\max_{\mathbf{R}_x, \boldsymbol{\Pi}} \quad & \text{Tr}\left(\mathbf{E}^H(\mathbf{R}_x \otimes \mathbf{I}_{M_R})\mathbf{E} - \boldsymbol{\Pi}\right) \\
\text{s.t.} \quad & [\mathbf{R}_x]_{m,m} = 1, \quad m = 1, 2, \cdots, M_T \\
& \boldsymbol{\Lambda} \succeq 0 \\
& \|\mathbf{R}_x - \mathbf{I}_{M_T}\|^2 \leq \mu \\
& \mathbf{R}_x \succeq 0
\end{align}
这是一个半定规划(SDP)问题,可以通过凸优化方法有效求解。
4. 多径角度估计
由于测试(13)不可实现(矩阵A ( Θ 0 ) \mathbf{A}(\boldsymbol{\Theta}_0) A ( Θ 0 ) 和A ( Θ , Φ ) \mathbf{A}(\boldsymbol{\Theta}, \boldsymbol{\Phi}) A ( Θ , Φ ) 未知),我们需要开发估计这些矩阵的方法。
4.1 H 0 H_0 H 0 假设下的估计器
图4描述 :图4比较了Gauss-Newton (GN)和Levenberg-Marquardt (LM)方法在优化过程中的收敛行为。图4(a)显示了DOD和DOA角度差异较大时(( − 1.9 ° , − 13.2 ° ) (-1.9°, -13.2°) ( − 1 . 9 ° , − 1 3 . 2 ° ) ),两种方法都表现出相似的收敛行为。图4(b)显示了角度差异较小时(( − 1.9 ° , − 3.2 ° ) (-1.9°, -3.2°) ( − 1 . 9 ° , − 3 . 2 ° ) ),GN方法面临收敛挑战,而LM方法通过正则化项解决了这个问题并展现出更强的鲁棒性。
我们提出一种迭代过程来解决角度估计问题。定义r ( t ) \mathbf{r}^{(t)} r ( t ) 为第t t t 次迭代中的残差,初始化为r ( 0 ) = z ˉ \mathbf{r}^{(0)} = \bar{\mathbf{z}} r ( 0 ) = z ˉ 。直接路径角度集合初始化为空集,即Θ 0 ( 0 ) = ∅ \boldsymbol{\Theta}_0^{(0)} = \emptyset Θ 0 ( 0 ) = ∅ 且K ^ 0 ( 0 ) = 0 \hat{K}_0^{(0)} = 0 K ^ 0 ( 0 ) = 0 。
在第t t t 次迭代中,我们插入一条路径到集合中,K ^ 0 ( t ) = K ^ 0 ( t − 1 ) + 1 \hat{K}_0^{(t)} = \hat{K}_0^{(t-1)} + 1 K ^ 0 ( t ) = K ^ 0 ( t − 1 ) + 1 。通过评估以下式子最小化残差的2-范数:
θ ^ ( t ) = arg max θ ( t ) ∈ { θ ~ 1 , θ ~ 2 , ⋯ , θ ~ G } ∣ ( r ( t − 1 ) ) H a ˉ ( θ ( t ) ) ∣ \hat{\theta}^{(t)} = \arg\max_{\theta^{(t)} \in \{\tilde{\theta}_1, \tilde{\theta}_2, \cdots, \tilde{\theta}_G\}} \left|(\mathbf{r}^{(t-1)})^H \bar{\mathbf{a}}(\theta^{(t)})\right|
θ ^ ( t ) = arg θ ( t ) ∈ { θ ~ 1 , θ ~ 2 , ⋯ , θ ~ G } max ∣ ∣ ∣ ∣ ( r ( t − 1 ) ) H a ˉ ( θ ( t ) ) ∣ ∣ ∣ ∣
并更新角度矩阵为Θ 0 ( t , 0 ) = [ ( Θ 0 ( t − 1 ) ) T , θ ^ ( t ) ] T \boldsymbol{\Theta}_0^{(t,0)} = [(\boldsymbol{\Theta}_0^{(t-1)})^T, \hat{\theta}^{(t)}]^T Θ 0 ( t , 0 ) = [ ( Θ 0 ( t − 1 ) ) T , θ ^ ( t ) ] T 。
随后通过Gauss-Newton (GN)迭代来增强此估计的准确性:
Θ 0 ( t , i + 1 ) = Θ 0 ( t , i ) − ( H 0 ( t , i ) ) − 1 g 0 ( t , i ) \boldsymbol{\Theta}_0^{(t,i+1)} = \boldsymbol{\Theta}_0^{(t,i)} - (\mathbf{H}_0^{(t,i)})^{-1}\mathbf{g}_0^{(t,i)}
Θ 0 ( t , i + 1 ) = Θ 0 ( t , i ) − ( H 0 ( t , i ) ) − 1 g 0 ( t , i )
其中梯度g 0 ( t , i ) \mathbf{g}_0^{(t,i)} g 0 ( t , i ) 和Hessian矩阵H 0 ( t , i ) \mathbf{H}_0^{(t,i)} H 0 ( t , i ) 的表达式在附录A中给出。
4.2 H 1 H_1 H 1 假设下的估计器
在H 1 H_1 H 1 下,算法是前一个算法的扩展,现在必须估计直接路径和一阶路径的角度。为了减少直接路径和一阶路径之间的干扰,我们分别在直接路径和一阶路径上实现估计过程。
搜索额外一阶路径对的粗略估计通过在两个均匀G G G 维网格上搜索获得:
( ϑ ^ ( t ) , ϕ ^ ( t ) ) = arg max ϑ ( t ) ∈ Ξ t ϕ ( t ) ∈ Ξ r ϑ ( t ) < ϕ ( t ) [ ∣ ( r ( t − 1 ) ) H ( a T ( ϑ ( t ) ) ∘ a R ( ϕ ( t ) ) ) ∣ + ∣ ( r ( t − 1 ) ) H ( a T ( ϕ ( t ) ) ∘ a R ( ϑ ( t ) ) ) ∣ ] (\hat{\vartheta}^{(t)}, \hat{\phi}^{(t)}) = \arg\max_{\substack{\vartheta^{(t)} \in \Xi_t \\ \phi^{(t)} \in \Xi_r \\ \vartheta^{(t)} < \phi^{(t)}}} \left[|(\mathbf{r}^{(t-1)})^H(\mathbf{a}_T(\vartheta^{(t)}) \circ \mathbf{a}_R(\phi^{(t)}))| + |(\mathbf{r}^{(t-1)})^H(\mathbf{a}_T(\phi^{(t)}) \circ \mathbf{a}_R(\vartheta^{(t)}))|\right]
( ϑ ^ ( t ) , ϕ ^ ( t ) ) = arg ϑ ( t ) ∈ Ξ t ϕ ( t ) ∈ Ξ r ϑ ( t ) < ϕ ( t ) max [ ∣ ( r ( t − 1 ) ) H ( a T ( ϑ ( t ) ) ∘ a R ( ϕ ( t ) ) ) ∣ + ∣ ( r ( t − 1 ) ) H ( a T ( ϕ ( t ) ) ∘ a R ( ϑ ( t ) ) ) ∣ ]
由于在H 1 H_1 H 1 假设下直接和一阶路径的混合,当DOD和DOA之间的差异不大时,GN方法可能由于Hessian中的秩缺陷而导致不稳定的估计。因此,我们采用LM方法来更新角度估计:
h ( t , i ) = − ( H ( t , i ) + μ ( t , i ) I K ^ ( t ) ) − 1 g ( t , i ) \mathbf{h}^{(t,i)} = -\left(\mathbf{H}^{(t,i)} + \mu^{(t,i)}\mathbf{I}_{\hat{K}^{(t)}}\right)^{-1}\mathbf{g}^{(t,i)}
h ( t , i ) = − ( H ( t , i ) + μ ( t , i ) I K ^ ( t ) ) − 1 g ( t , i )
其中μ ( t , i ) \mu^{(t,i)} μ ( t , i ) 是阻尼参数,通过增益比控制:
ϱ ( t , i ) = F ˉ ( Θ ˉ ( t , i ) ) − F ˉ ( Θ ˉ ( t , i ) + h ( t , i ) ) 1 2 ( h ( t , i ) ) H ( μ ( t , i ) h ( t , i ) − g ( t , i ) ) \varrho^{(t,i)} = \frac{\bar{F}(\bar{\boldsymbol{\Theta}}^{(t,i)}) - \bar{F}(\bar{\boldsymbol{\Theta}}^{(t,i)} + \mathbf{h}^{(t,i)})}{\frac{1}{2}(\mathbf{h}^{(t,i)})^H(\mu^{(t,i)}\mathbf{h}^{(t,i)} - \mathbf{g}^{(t,i)})}
ϱ ( t , i ) = 2 1 ( h ( t , i ) ) H ( μ ( t , i ) h ( t , i ) − g ( t , i ) ) F ˉ ( Θ ˉ ( t , i ) ) − F ˉ ( Θ ˉ ( t , i ) + h ( t , i ) )
5. 仿真和实验结果
5.1 仿真设置
图5描述 :图5展示了MIMO雷达天线的实际和虚拟布局。图5(a)显示了均匀线性阵列(ULA)配置,其中发射和接收天线均匀间隔半波长。图5(b)显示了稀疏线性阵列(SLA)配置,其中天线不均匀间隔以增加孔径但会引入栅瓣。虚拟阵列(蓝色圆圈)由发射和接收阵列的卷积形成。
仿真参数设置如下:
雷达工作频率为79 GHz,载波波长λ = 3.8 \lambda = 3.8 λ = 3 . 8 mm
发射元素数量M T = 6 M_T = 6 M T = 6 ,接收元素M R = 8 M_R = 8 M R = 8
首先使用如图5(a)所示的均匀线性阵列(ULA)进行仿真
通过保持M T M_T M T 和M R M_R M R 恒定,我们确保检测性能的一致上界,并随后验证图5(b)所示SLA的性能
噪声根据方差σ 2 = 1 \sigma^2 = 1 σ 2 = 1 的高斯分布随机生成
路径幅度根据β ∼ C N ( 0 , σ β 2 I 2 K 1 ) \boldsymbol{\beta} \sim \mathcal{CN}(0, \sigma_\beta^2\mathbf{I}_{2K_1}) β ∼ C N ( 0 , σ β 2 I 2 K 1 ) ,α ∼ C N ( 0 , σ α 2 I K 0 ) \boldsymbol{\alpha} \sim \mathcal{CN}(0, \sigma_\alpha^2\mathbf{I}_{K_0}) α ∼ C N ( 0 , σ α 2 I K 0 ) 生成
通过以2 ° 2° 2 ° 步长离散化角度空间[ − 90 ° , 90 ° ] [-90°, 90°] [ − 9 0 ° , 9 0 ° ] 获得网格
5.2 估计性能
图6描述 :图6显示了不同算法在ULA和SLA配置下的RMSE性能。图6(a)和6(b)显示了ULA中直接路径(RMSE₀)和一阶路径(RMSE₁)的估计误差。图6©和6(d)显示了SLA的相应结果。在所有情况下,所提出的CSCD方法都优于基于网格的OMP、IAA和LASSO方法,特别是在高SNR条件下,这归因于连续域优化避免了网格失配问题。
我们评估所提出算法的角度估计均方根误差(RMSE)。注意算法返回一组估计,对应于真实路径或错误路径,如果没有接近其方向的估计,则无法检测到路径。因此,我们参考基于正确路径估计的RMSE。具体地,一阶路径和直接路径的RMSE计算为:
RMSE 1 = 1 M C ∑ m = 1 M C 1 2 ∣ Ω 1 m ∣ ∑ j ∈ Ω 1 m [ ( ϑ j ( m ) − ϑ ^ j ( m ) ) 2 + ( ϕ j ( m ) − ϕ ^ j ( m ) ) 2 ] \text{RMSE}_1 = \sqrt{\frac{1}{M_C} \sum_{m=1}^{M_C} \frac{1}{2|\Omega_1^m|} \sum_{j \in \Omega_1^m} \left[(\vartheta_j^{(m)} - \hat{\vartheta}_j^{(m)})^2 + (\phi_j^{(m)} - \hat{\phi}_j^{(m)})^2\right]}
RMSE 1 = M C 1 m = 1 ∑ M C 2 ∣ Ω 1 m ∣ 1 j ∈ Ω 1 m ∑ [ ( ϑ j ( m ) − ϑ ^ j ( m ) ) 2 + ( ϕ j ( m ) − ϕ ^ j ( m ) ) 2 ]
RMSE 0 = 1 M C ∑ m = 1 M C 1 ∣ Ω 0 m ∣ ∑ j ∈ Ω 0 m ( θ j ( m ) − θ ^ j ( m ) ) 2 \text{RMSE}_0 = \sqrt{\frac{1}{M_C} \sum_{m=1}^{M_C} \frac{1}{|\Omega_0^m|} \sum_{j \in \Omega_0^m} (\theta_j^{(m)} - \hat{\theta}_j^{(m)})^2}
RMSE 0 = M C 1 m = 1 ∑ M C ∣ Ω 0 m ∣ 1 j ∈ Ω 0 m ∑ ( θ j ( m ) − θ ^ j ( m ) ) 2
其中M C M_C M C 是运行次数,Ω 1 m \Omega_1^m Ω 1 m 和Ω 0 m \Omega_0^m Ω 0 m 是第m m m 次仿真中识别的一阶路径和直接路径的索引集。
5.3 检测性能
图7描述 :图7比较了H 0 H_0 H 0 场景中a ( θ ) , a ( ψ ) \mathbf{a}(\theta), \mathbf{a}(\psi) a ( θ ) , a ( ψ ) 的相关性(图7a)和H 1 H_1 H 1 场景中a T ( ϑ ) ∘ a R ( ϕ ) , a ( ψ ) \mathbf{a}_T(\vartheta) \circ \mathbf{a}_R(\phi), \mathbf{a}(\psi) a T ( ϑ ) ∘ a R ( ϕ ) , a ( ψ ) 的相关性(图7b)。ULA显示了更清晰的主瓣和较低的旁瓣,而SLA虽然具有更窄的波束宽度但旁瓣更高,这解释了SLA配置中性能下降的原因。
图8描述 :图8展示了ULA和SLA配置下不同( K 1 , K 0 ) (K_1, K_0) ( K 1 , K 0 ) 组合的检测概率P d P_d P d 与σ β 2 / σ 2 \sigma_\beta^2/\sigma^2 σ β 2 / σ 2 的关系。图8(a)和8(b)显示了ULA的结果,其中GLRT-CSCD的性能接近理论上界。图8©和8(d)显示了SLA的结果,其中由于较高的旁瓣,性能差距更大。在所有情况下,所提出的GLRT-CSCD都优于GLRT-OMP、GLRT-LASSO和GLRT-IAA。
图9描述 :图9比较了不同M T M R M_T M_R M T M R 值下的检测性能。随着系统自由度的增加(从M T M R = 12 M_T M_R = 12 M T M R = 1 2 到48),检测性能提高,但收益逐渐递减。这表明对于给定的( K 0 , K 1 ) (K_0, K_1) ( K 0 , K 1 ) 值,存在一个最优的天线配置超过该配置后性能改善有限。
5.4 实验结果
图10描述 :图10展示了实验场景。图10(a)是实验环境的照片,显示了被混凝土墙包围的道路,这创建了多径传播的理想条件。图10(b)显示了雷达点云,蓝色椭圆标记了由一阶路径引起的幽灵目标。
图11描述 :图11展示了使用不同方法检测和消除幽灵目标的结果。图11(a)-©分别显示了GLRT-OMP、GLRT-LASSO和GLRT-IAA的结果,这些方法未能成功移除所有幽灵目标,并且错误地移除了一些静止目标的直接路径。图11(d)显示了所提出的GLRT-CSCD方法有效地消除了所有幽灵目标,同时保留了静止目标的直接路径。
我们使用实验数据评估所提出检测器的目标检测性能。数据由毫米波f 0 = 77 f_0 = 77 f 0 = 7 7 GHz MIMO雷达获得,其中M T = 8 M_T = 8 M T = 8 个发射天线和M R = 16 M_R = 16 M R = 1 6 个接收天线,均匀间隔。发射侧间距为4.5 λ 4.5\lambda 4 . 5 λ ,接收侧间距为4 λ 4\lambda 4 λ 。
6. 结论
本文研究了汽车雷达在多径存在下的幽灵目标检测。间接路径的存在被建模为二元复合假设检验,提出了GLRT检测器来确定延迟-多普勒单元中是否存在间接路径。如果单元包含间接路径,可以移除幽灵目标并保留所需的直接路径。基于完美角度估计下GLRT检测性能的理论分析,我们推导了一种凸波形优化方法,可以增强检测性能。考虑到直接和间接路径角度均未知的实际场景,我们提出了一种稀疏增强的CS方法来估计连续域中的角度参数。仿真结果表明,所提出的算法优于现有的基于网格的估计器,从而导致更好的检测性能。提出的检测器的虚警率可以控制,ULA情况下的检测性能接近理论界限。最后,实验结果证明了所提出方法的有效性。
附录
附录A:H 0 H_0 H 0 下梯度和Hessian矩阵的推导
为了清晰起见,我们在以下一些推导中省略函数的上标( t , i ) (t,i) ( t , i ) 和输入变量,即F = F ( Θ 0 ( t , i ) ) F = F(\boldsymbol{\Theta}_0^{(t,i)}) F = F ( Θ 0 ( t , i ) ) 和A ˉ 0 = A ˉ ( Θ 0 ( t , i ) ) \bar{\mathbf{A}}_0 = \bar{\mathbf{A}}(\boldsymbol{\Theta}_0^{(t,i)}) A ˉ 0 = A ˉ ( Θ 0 ( t , i ) ) 。
定义F = f H f F = \mathbf{f}^H\mathbf{f} F = f H f ,其中f = z ˉ − A ˉ A ˉ † z ˉ \mathbf{f} = \bar{\mathbf{z}} - \bar{\mathbf{A}}\bar{\mathbf{A}}^\dagger\bar{\mathbf{z}} f = z ˉ − A ˉ A ˉ † z ˉ ,F F F 相对于Θ 0 ∈ R K 0 × 1 \boldsymbol{\Theta}_0 \in \mathbb{R}^{K_0 \times 1} Θ 0 ∈ R K 0 × 1 的梯度可以计算为:
g 0 = [ ∂ F ∂ θ 1 , ∂ F ∂ θ 2 , … , ∂ F ∂ θ K 0 ] T \mathbf{g}_0 = \left[\frac{\partial F}{\partial \theta_1}, \frac{\partial F}{\partial \theta_2}, \ldots, \frac{\partial F}{\partial \theta_{K_0}}\right]^T
g 0 = [ ∂ θ 1 ∂ F , ∂ θ 2 ∂ F , … , ∂ θ K 0 ∂ F ] T
其中第q q q 个元素[ g 0 ] q [\mathbf{g}_0]_q [ g 0 ] q 给出为∂ F ∂ θ q = 2 Re ( ( ∂ f ∂ θ q ) H f ) \frac{\partial F}{\partial \theta_q} = 2\text{Re}\left(\left(\frac{\partial \mathbf{f}}{\partial \theta_q}\right)^H \mathbf{f}\right) ∂ θ q ∂ F = 2 Re ( ( ∂ θ q ∂ f ) H f ) 。
根据[49]中的推导,我们得到:
[ g 0 ] q = − 2 Re { Tr { A ˉ 0 † z ˉ z ˉ H P 0 A ˉ q } } [\mathbf{g}_0]_q = -2\text{Re}\{\text{Tr}\{\bar{\mathbf{A}}_0^\dagger \bar{\mathbf{z}}\bar{\mathbf{z}}^H \mathbf{P}_0 \bar{\mathbf{A}}_q\}\}
[ g 0 ] q = − 2 Re { Tr { A ˉ 0 † z ˉ z ˉ H P 0 A ˉ q } }
其中A ˉ q = ∂ A ˉ 0 ∂ θ q = [ 0 , 0 , … , ∂ a ˉ ∂ θ q , … , 0 ] \bar{\mathbf{A}}_q = \frac{\partial \bar{\mathbf{A}}_0}{\partial \theta_q} = [0, 0, \ldots, \frac{\partial \bar{\mathbf{a}}}{\partial \theta_q}, \ldots, 0] A ˉ q = ∂ θ q ∂ A ˉ 0 = [ 0 , 0 , … , ∂ θ q ∂ a ˉ , … , 0 ] ,其中∂ a ˉ ∂ θ q = ∂ a ˉ ( θ q ) ∂ θ q \frac{\partial \bar{\mathbf{a}}}{\partial \theta_q} = \frac{\partial \bar{\mathbf{a}}(\theta_q)}{\partial \theta_q} ∂ θ q ∂ a ˉ = ∂ θ q ∂ a ˉ ( θ q ) 。
Hessian矩阵H 0 \mathbf{H}_0 H 0 表示F F F 相对于Θ 0 \boldsymbol{\Theta}_0 Θ 0 的近似二阶偏导数。在此矩阵中,第( q , p ) (q,p) ( q , p ) 元素表示为[ H 0 ] q , p = 2 Re { ( ∂ f ∂ θ q ) H ∂ f ∂ θ p } [\mathbf{H}_0]_{q,p} = 2\text{Re}\left\{\left(\frac{\partial \mathbf{f}}{\partial \theta_q}\right)^H \frac{\partial \mathbf{f}}{\partial \theta_p}\right\} [ H 0 ] q , p = 2 Re { ( ∂ θ q ∂ f ) H ∂ θ p ∂ f } 并且可以计算为:
[ H 0 ] q , p = 2 Re { Tr { A ˉ p A ˉ 0 † z ˉ z ˉ H ( A ˉ 0 † ) H A ˉ q H P 0 } } [\mathbf{H}_0]_{q,p} = 2\text{Re}\{\text{Tr}\{\bar{\mathbf{A}}_p\bar{\mathbf{A}}_0^\dagger \bar{\mathbf{z}}\bar{\mathbf{z}}^H(\bar{\mathbf{A}}_0^\dagger)^H \bar{\mathbf{A}}_q^H \mathbf{P}_0\}\}
[ H 0 ] q , p = 2 Re { Tr { A ˉ p A ˉ 0 † z ˉ z ˉ H ( A ˉ 0 † ) H A ˉ q H P 0 } }
+ 2 Re { Tr { A ˉ p H P 0 z ˉ z ˉ H P 0 A ˉ q A ˉ 0 † ( A ˉ 0 † ) H } } + 2\text{Re}\{\text{Tr}\{\bar{\mathbf{A}}_p^H \mathbf{P}_0 \bar{\mathbf{z}}\bar{\mathbf{z}}^H \mathbf{P}_0 \bar{\mathbf{A}}_q \bar{\mathbf{A}}_0^\dagger(\bar{\mathbf{A}}_0^\dagger)^H\}\}
+ 2 Re { Tr { A ˉ p H P 0 z ˉ z ˉ H P 0 A ˉ q A ˉ 0 † ( A ˉ 0 † ) H } }
定义偏导矩阵D 0 = [ ∂ a ˉ ∂ θ 1 , ∂ a ˉ ∂ θ 2 , … , ∂ a ˉ ∂ θ K 0 ] \mathbf{D}_0 = \left[\frac{\partial \bar{\mathbf{a}}}{\partial \theta_1}, \frac{\partial \bar{\mathbf{a}}}{\partial \theta_2}, \ldots, \frac{\partial \bar{\mathbf{a}}}{\partial \theta_{K_0}}\right] D 0 = [ ∂ θ 1 ∂ a ˉ , ∂ θ 2 ∂ a ˉ , … , ∂ θ K 0 ∂ a ˉ ] ,则g 0 \mathbf{g}_0 g 0 和H 0 \mathbf{H}_0 H 0 的矩阵形式可以给出为式(28)和(29)。
附录B:H 1 H_1 H 1 下梯度和Hessian矩阵的推导
为了清晰起见,我们在以下推导中省略上标和函数的输入变量,即F ˉ = F ˉ ( Θ ˉ ( t , i ) ) \bar{F} = \bar{F}(\bar{\boldsymbol{\Theta}}^{(t,i)}) F ˉ = F ˉ ( Θ ˉ ( t , i ) ) 和A ˉ = A ˉ ( Θ ˉ ( t , i ) , Φ ˉ ( t , i ) ) \bar{\mathbf{A}} = \bar{\mathbf{A}}(\bar{\boldsymbol{\Theta}}^{(t,i)}, \bar{\boldsymbol{\Phi}}^{(t,i)}) A ˉ = A ˉ ( Θ ˉ ( t , i ) , Φ ˉ ( t , i ) ) 。在下文中,我们推导g T \mathbf{g}_T g T 和H T T \mathbf{H}_{TT} H T T 的矩阵表达式,g R \mathbf{g}_R g R 、g 0 \mathbf{g}_0 g 0 、H T R \mathbf{H}_{TR} H T R 、H R R \mathbf{H}_{RR} H R R 、H R T \mathbf{H}_{RT} H R T 、H 0 T \mathbf{H}_{0T} H 0 T 、H T 0 \mathbf{H}_{T0} H T 0 、H R 0 \mathbf{H}_{R0} H R 0 、H 0 R \mathbf{H}_{0R} H 0 R 、H 00 \mathbf{H}_{00} H 0 0 的推导遵循类似的论证,为简洁起见省略。
类似于式(40),我们知道g T \mathbf{g}_T g T 的第q q q 个元素可以给出为:
[ g T ] q = − 2 Re { Tr { A ˉ † z ˉ z ˉ H P 1 A ˉ q ′ } } [\mathbf{g}_T]_q = -2\text{Re}\{\text{Tr}\{\bar{\mathbf{A}}^\dagger \bar{\mathbf{z}}\bar{\mathbf{z}}^H \mathbf{P}_1 \bar{\mathbf{A}}_q'\}\}
[ g T ] q = − 2 Re { Tr { A ˉ † z ˉ z ˉ H P 1 A ˉ q ′ } }
= − 2 Re { Tr { Γ A ˉ q ′ } } = -2\text{Re}\{\text{Tr}\{\boldsymbol{\Gamma}\bar{\mathbf{A}}_q'\}\}
= − 2 Re { Tr { Γ A ˉ q ′ } }
其中Γ = A ˉ † z ˉ z ˉ H P 1 ∈ C ( 2 K 1 + K 0 ) × M T M R \boldsymbol{\Gamma} = \bar{\mathbf{A}}^\dagger \bar{\mathbf{z}}\bar{\mathbf{z}}^H \mathbf{P}_1 \in \mathbb{C}^{(2K_1+K_0) \times M_T M_R} Γ = A ˉ † z ˉ z ˉ H P 1 ∈ C ( 2 K 1 + K 0 ) × M T M R ,A ˉ q ′ = ∂ A ˉ ∂ ϑ q = [ 0 , 0 , … , ∂ a 1 ∂ ϑ q , … , 0 , … , ∂ a 2 ∂ ϑ q , … , 0 ] \bar{\mathbf{A}}_q' = \frac{\partial \bar{\mathbf{A}}}{\partial \vartheta_q} = [0, 0, \ldots, \frac{\partial \mathbf{a}_1}{\partial \vartheta_q}, \ldots, 0, \ldots, \frac{\partial \mathbf{a}_2}{\partial \vartheta_q}, \ldots, 0] A ˉ q ′ = ∂ ϑ q ∂ A ˉ = [ 0 , 0 , … , ∂ ϑ q ∂ a 1 , … , 0 , … , ∂ ϑ q ∂ a 2 , … , 0 ] ,其中:
∂ a 1 ∂ ϑ q = Σ x 1 / 2 ∂ a T ( ϑ q ) ⊗ a R ( ϕ q ) ∂ ϑ q \frac{\partial \mathbf{a}_1}{\partial \vartheta_q} = \boldsymbol{\Sigma}_x^{1/2} \frac{\partial \mathbf{a}_T(\vartheta_q) \otimes \mathbf{a}_R(\phi_q)}{\partial \vartheta_q}
∂ ϑ q ∂ a 1 = Σ x 1 / 2 ∂ ϑ q ∂ a T ( ϑ q ) ⊗ a R ( ϕ q )
∂ a 2 ∂ ϑ q = Σ x 1 / 2 ∂ a T ( ϕ q ) ⊗ a R ( ϑ q ) ∂ ϑ q \frac{\partial \mathbf{a}_2}{\partial \vartheta_q} = \boldsymbol{\Sigma}_x^{1/2} \frac{\partial \mathbf{a}_T(\phi_q) \otimes \mathbf{a}_R(\vartheta_q)}{\partial \vartheta_q}
∂ ϑ q ∂ a 2 = Σ x 1 / 2 ∂ ϑ q ∂ a T ( ϕ q ) ⊗ a R ( ϑ q )
我们将矩阵Γ \boldsymbol{\Gamma} Γ 划分为三个子矩阵,表示为Γ = [ Γ 1 , Γ 2 , Γ 0 ] \boldsymbol{\Gamma} = [\boldsymbol{\Gamma}_1, \boldsymbol{\Gamma}_2, \boldsymbol{\Gamma}_0] Γ = [ Γ 1 , Γ 2 , Γ 0 ] ,其中Γ 1 , Γ 2 ∈ C K 1 × M T M R \boldsymbol{\Gamma}_1, \boldsymbol{\Gamma}_2 \in \mathbb{C}^{K_1 \times M_T M_R} Γ 1 , Γ 2 ∈ C K 1 × M T M R ,Γ 0 ∈ C K 0 × M T M R \boldsymbol{\Gamma}_0 \in \mathbb{C}^{K_0 \times M_T M_R} Γ 0 ∈ C K 0 × M T M R 。则式(42)可以重写为:
[ g T ] q = − 2 Re { Γ 1 ( q ) ( ∂ a 1 ∂ ϑ q ) T + Γ 2 ( q ) ( ∂ a 2 ∂ ϑ q ) T } [\mathbf{g}_T]_q = -2\text{Re}\left\{\boldsymbol{\Gamma}_1^{(q)} \left(\frac{\partial \mathbf{a}_1}{\partial \vartheta_q}\right)^T + \boldsymbol{\Gamma}_2^{(q)} \left(\frac{\partial \mathbf{a}_2}{\partial \vartheta_q}\right)^T\right\}
[ g T ] q = − 2 Re { Γ 1 ( q ) ( ∂ ϑ q ∂ a 1 ) T + Γ 2 ( q ) ( ∂ ϑ q ∂ a 2 ) T }
其中Γ 1 ( q ) \boldsymbol{\Gamma}_1^{(q)} Γ 1 ( q ) 和Γ 2 ( q ) \boldsymbol{\Gamma}_2^{(q)} Γ 2 ( q ) 分别表示Γ 1 \boldsymbol{\Gamma}_1 Γ 1 和Γ 2 \boldsymbol{\Gamma}_2 Γ 2 的第q q q 行。定义两个偏导矩阵:
D T 1 = [ ∂ a 1 ∂ ϑ 1 , ∂ a 1 ∂ ϑ 2 , … , ∂ a 1 ∂ ϑ K 1 ] \mathbf{D}_{T1} = \left[\frac{\partial \mathbf{a}_1}{\partial \vartheta_1}, \frac{\partial \mathbf{a}_1}{\partial \vartheta_2}, \ldots, \frac{\partial \mathbf{a}_1}{\partial \vartheta_{K_1}}\right]
D T 1 = [ ∂ ϑ 1 ∂ a 1 , ∂ ϑ 2 ∂ a 1 , … , ∂ ϑ K 1 ∂ a 1 ]
D T 2 = [ ∂ a 2 ∂ ϑ 1 , ∂ a 2 ∂ ϑ 2 , … , ∂ a 2 ∂ ϑ K 1 ] \mathbf{D}_{T2} = \left[\frac{\partial \mathbf{a}_2}{\partial \vartheta_1}, \frac{\partial \mathbf{a}_2}{\partial \vartheta_2}, \ldots, \frac{\partial \mathbf{a}_2}{\partial \vartheta_{K_1}}\right]
D T 2 = [ ∂ ϑ 1 ∂ a 2 , ∂ ϑ 2 ∂ a 2 , … , ∂ ϑ K 1 ∂ a 2 ]
我们可以得到g T \mathbf{g}_T g T 的矩阵形式:
g T = − 2 Re { diag { Γ 1 D T 1 + Γ 2 D T 2 } } \mathbf{g}_T = -2\text{Re}\{\text{diag}\{\boldsymbol{\Gamma}_1\mathbf{D}_{T1} + \boldsymbol{\Gamma}_2\mathbf{D}_{T2}\}\}
g T = − 2 Re { diag { Γ 1 D T 1 + Γ 2 D T 2 } }
类似地,定义D R 1 \mathbf{D}_{R1} D R 1 、D R 2 \mathbf{D}_{R2} D R 2 和D 0 \mathbf{D}_0 D 0 ,得到:
g R = − 2 Re { diag { Γ 1 D R 1 + Γ 2 D R 2 } } \mathbf{g}_R = -2\text{Re}\{\text{diag}\{\boldsymbol{\Gamma}_1\mathbf{D}_{R1} + \boldsymbol{\Gamma}_2\mathbf{D}_{R2}\}\}
g R = − 2 Re { diag { Γ 1 D R 1 + Γ 2 D R 2 } }
g 0 = − 2 Re { diag { Γ 0 D 0 } } \mathbf{g}_0 = -2\text{Re}\{\text{diag}\{\boldsymbol{\Gamma}_0\mathbf{D}_0\}\}
g 0 = − 2 Re { diag { Γ 0 D 0 } }
Hessian矩阵H T T \mathbf{H}_{TT} H T T 表示相对于Θ 1 \boldsymbol{\Theta}_1 Θ 1 的二阶偏导数,其中第( q , p ) (q,p) ( q , p ) 元素为:
[ H T T ] q , p = 2 Re { Tr { A ˉ p ′ A ˉ † z ˉ z ˉ H ( A ˉ † ) H ( A ˉ q ′ ) H P 1 } } [\mathbf{H}_{TT}]_{q,p} = 2\text{Re}\{\text{Tr}\{\bar{\mathbf{A}}_p' \bar{\mathbf{A}}^\dagger \bar{\mathbf{z}}\bar{\mathbf{z}}^H (\bar{\mathbf{A}}^\dagger)^H (\bar{\mathbf{A}}_q')^H \mathbf{P}_1\}\}
[ H T T ] q , p = 2 Re { Tr { A ˉ p ′ A ˉ † z ˉ z ˉ H ( A ˉ † ) H ( A ˉ q ′ ) H P 1 } }
+ 2 Re { Tr { ( A ˉ p ′ ) H P 1 z ˉ z ˉ H P 1 A ˉ q ′ A ˉ † ( A ˉ † ) H } } + 2\text{Re}\{\text{Tr}\{(\bar{\mathbf{A}}_p')^H \mathbf{P}_1 \bar{\mathbf{z}}\bar{\mathbf{z}}^H \mathbf{P}_1 \bar{\mathbf{A}}_q' \bar{\mathbf{A}}^\dagger (\bar{\mathbf{A}}^\dagger)^H\}\}
+ 2 Re { Tr { ( A ˉ p ′ ) H P 1 z ˉ z ˉ H P 1 A ˉ q ′ A ˉ † ( A ˉ † ) H } }
经过详细推导,我们可以得到各个Hessian块的矩阵形式(式50-58)。这些表达式涉及矩阵S \mathbf{S} S 和C \mathbf{C} C 的分块形式以及偏导矩阵D T \mathbf{D}_T D T 、D R \mathbf{D}_R D R 和D 0 \mathbf{D}_0 D 0 的各种组合。
评论(0)