面向非均衡样本的雷达字提取方法

allin2022-09-03 293

1.本发明属于电子对抗技术领域，具体涉及一种面向非均衡样本的雷达字提取方法。

背景技术：

2.为了深入研究多功能相控阵雷达的行为规律，为战场中的上级指挥决策提供直接有效的一手作战情报，加拿大mcmaster大学的visnevski于2005年在其博士论文中建立了一种多功能雷达的句法模型，该模型运用离散事件系统(discrete event system，des)的相关理论展开建模，以“雷达字(radar word)”为最基本的模型单元，构建了雷达字、雷达短语和雷达句子逐级递进的层级模型。后续进行多功能相控阵雷达的行为分析，也大多基于句法模型中的雷达字，所以雷达字是否提取准确，对之后多功能相控阵雷达(multifunction phased array radar，mpar)行为认知具有至关重要的作用。haykin s运用事件驱动方法进行雷达字的提取，简单易实现，但当脉冲描述字(pulse description word，pdw)中其他参数不同，而脉冲到达时间(time of arrival，toa)相同时，将会导致雷达字难以区分。王勇军提出了一种改进的事件驱动的mfr雷达字提取方法，但在虚假脉冲增多时提取准确率下降太快。欧健提出一种基于匹配滤波的雷达字提取方法，将雷达字提取转化为从随机信号中找出确定信号的问题，但其在测量误差和漏脉冲率较低情况下的提取性能不如传统算法。刘海军运用三级匹配(数据库级、脉冲级和码序列级)的方法，在脉冲丢失和假脉冲的噪声环境下也具有良好的提取能力，但该方法没有充分利用侦收信号的全部信息，只使用了脉冲到达时间一个参数，在很多特殊情况下提取效果很差。李程利用改进的ttp变换法进行雷达字提取，但也只用到了toa信息。因此，传统提取雷达字算法对侦收信号的信息利用不充分，导致雷达字提取效率和准确度有限。
3.此外，已有的雷达字研究工作都是基于均衡数据的假设前提下进行，但实际情况下，电子对抗环境复杂多变，侦察过程中会侦察到在雷达数据库中未出现的工作模式类型，同时其数量远远小于数据库中样本数。特别是当mpar在某个功能状态下持续工作较长时间，或者其为了规避探测很少使用某种工作状态，因此，侦收设备截获的雷达脉冲数据并不会是其各个功能状态的均匀分布，而是具有较大密度差异的不均衡数据。如何对该情况下的雷达字提取是一个很大的挑战，且未有人进行相关研究。

技术实现要素：

4.针对现有技术存在的缺陷，本发明提供一种面向非均衡样本的雷达字提取方法，可有效解决上述问题。
5.本发明采用的技术方案如下：
6.本发明提供一种面向非均衡样本的雷达字提取方法，包括以下步骤：
7.步骤1，接收待处理的侦收脉冲原始序列p＝{p1，p2，,...,pn}；其中，n代表侦收脉冲原始序列p的样本数量；p1，p2，,...,pn代表侦收脉冲原始序列p的第1个样本，第2个样
本,...,第n个样本；对于任意第i个样本pi，为三维分量样本，表示为：pi＝{prii,pwi,rfi}；其中，prii代表脉冲重复间隔分量，pwi代表脉宽分量，rfi代表脉冲间载频分量；
8.步骤2，样本标准化处理过程：
9.对于侦收脉冲原始序列p的每个原始分量序列，表示为：原始分量序列a＝{a1，a2，,...,an}，其中，a代表pri分量、pw分量和rf分量中的任意分量，均进行标准化处理，得到标准化分量序列b＝{b1，b2，,...,bn}；三种分量的标准化分量序列，形成侦收脉冲标准化序列p
″
＝{p
″1，p
″2，...,p
″n}；
10.标准化处理方法为：
11.步骤2.1，采用下式，计算原始分量序列a的均值
[0012][0013]
其中：ai代表原始分量序列a的第i个样本分量；
[0014]
步骤2.2，采用下式，计算原始分量序列a的方差s：
[0015][0016]
步骤2.3，采用下式，计算得到标准化分量序列中第i个样本分量bi：
[0017][0018]
步骤3，密度聚类：
[0019]
对侦收脉冲标准化序列p
″
＝{p
″1，p
″2,...,p
″n}进行密度聚类，得到j个雷达字簇，分别表示为c1,c2,...,cj；其中，对于第u个雷达字簇cu，u＝1，2,...,j，包含的样本个数为|cu|；
[0020]
步骤4，构建set集合：
[0021]
步骤4.1，对于第u个雷达字簇cu，采用下式，得到中心点的坐标
[0022][0023]
步骤4.2，由此得到j个中心点的坐标，表示为：形成虚拟候选聚类中心集合
[0024]
步骤4.3，计算虚拟候选聚类中心集合x中所有中心点的中心center的坐标；然后，计算虚拟候选聚类中心集合x中每个中心点到中心center的距离并排序，选取距离中心
center最远的中心点，表示为点q1；
[0025]
然后，将点q1放入集合set，并删除虚拟候选聚类中心集合x中的点q1；
[0026]
步骤4.4，重新计算虚拟候选聚类中心集合x中每个中心点到虚拟候选聚类中心集合x中其他所有中心点的距离之和，将距离之和排序，选择距离之和最小的中心点，表示为点q2；
[0027]
然后，将点q2放入集合set，并删除虚拟候选聚类中心集合x中的点q2；
[0028]
步骤4.5，返回步骤4.3，循环进行步骤4.3-步骤4.4，直至集合set中的元素个数达到预设置的雷达字个数k，以set集合中的k个元素作为初始聚类中心，对侦收脉冲标准化序列p
″
＝{p
″1，p
″2,...,p
″n}进行迭代聚类，得到k个簇，每个簇包括的标准化处理后的样本，按时间顺序排列，形成的标准化样本序列，即为提取到的一个雷达字，由此共提取到k个雷达字，即为提取到的非均衡样本的雷达字。
[0029]
优选的，步骤3中，采用的密度聚类为optics密度聚类算法。
[0030]
本发明提供的面向非均衡样本的雷达字提取方法具有以下优点：
[0031]
针对样本不均衡的侦收数据，本发明首次提出了此类情况下的雷达字提取方法，存在漏脉冲和测量误差的情形下较传统方法在提取准确率、f值和调整兰德系数等方面均有较大的提升，具有很强的鲁棒性。
附图说明
[0032]
图1为本发明提供的面向非均衡样本的雷达字提取方法的流程示意图；
[0033]
图2是本发明针对场景p得到k-optics算法的簇合并可达图；
[0034]
图3是聚类性能随rdl变化的性能图；
[0035]
图4是聚类性能随edl变化的性能图。
具体实施方式
[0036]
为了使本发明所解决的技术问题、技术方案及有益效果更加清楚明白，以下结合附图及实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅用以解释本发明，并不用于限定本发明。
[0037]
考虑到传统提取雷达字算法对侦收信号的信息利用不充分的因素，加上脉冲间载频(radar frequency，rf)、脉宽(pulse wide，pw)、脉冲重复间隔(pulse repetition interval，pri)的调制模式反映了脉冲信号的变化规律，是分析判断雷达行为规律的重要依据。因此，本技术将利用pri、pw和rf三个参数的时空信息，采取聚类的方法进行雷达字的提取。针对侦收样本不均衡的问题，本技术重点针对此类情况开发了一种基于改进optics聚类算法(k-optics)的雷达字提取方法，用于完成对多功能相控阵雷达的雷达字提取。
[0038]
本技术运用k-optics算法可以有效的处理非均衡数据集，不仅保留了optics算法的优点，同时通过迭代思想将簇进行合并，使算法在漏脉冲和测量误差较大情况下仍有很好的提取效果。
[0039]
参考图1，本发明提供一种面向非均衡样本的雷达字提取方法，包括以下步骤：
[0040]
步骤1，接收待处理的侦收脉冲原始序列p＝{p1，p2，,...,pn}；其中，n代表侦收脉冲原始序列p的样本数量；p1，p2，,...,pn代表侦收脉冲原始序列p的第1个样本，第2个样
本,...,第n个样本；对于任意第i个样本pi，为三维分量样本，表示为：pi＝{prii,pwi,rfi}；其中，prii代表脉冲重复间隔分量，pwi代表脉宽分量，rfi代表脉冲间载频分量；
[0041]
步骤2，样本标准化处理过程：
[0042]
对于侦收脉冲原始序列p的每个原始分量序列，表示为：原始分量序列a＝{a1，a2，,...,an}，其中，a代表pri分量、pw分量和rf分量中的任意分量，均进行标准化处理，得到标准化分量序列b＝{b1，b2，,...,bn}；三种分量的标准化分量序列，形成侦收脉冲标准化序列p
″
＝{p
″1，p
″2,...,p
″n}；
[0043]
标准化处理方法为：
[0044]
步骤2.1，采用下式，计算原始分量序列a的均值
[0045][0046]
其中：ai代表原始分量序列a的第i个样本分量；
[0047]
步骤2.2，采用下式，计算原始分量序列a的方差s：
[0048][0049]
步骤2.3，采用下式，计算得到标准化分量序列中第i个样本分量bi：
[0050][0051]
步骤3，密度聚类：
[0052]
对侦收脉冲标准化序列p
″
＝{p
″1，p
″2,...,p
″n}进行密度聚类，得到j个雷达字簇，分别表示为c1,c2,...,cj；其中，对于第u个雷达字簇cu，u＝1，2,...,j，包含的样本个数为|cu|；
[0053]
实际应用中，采用的密度聚类为optics密度聚类算法。
[0054]
步骤4，构建set集合：
[0055]
步骤4.1，对于第u个雷达字簇cu，采用下式，得到中心点的坐标
[0056][0057]
步骤4.2，由此得到j个中心点的坐标，表示为：形成虚拟候选聚类中心集合
[0058]
步骤4.3，计算虚拟候选聚类中心集合x中所有中心点的中心center的坐标；然后，计算虚拟候选聚类中心集合x中每个中心点到中心center的距离并排序，选取距离中心
center最远的中心点，表示为点q1；
[0059]
然后，将点q1放入集合set，并删除虚拟候选聚类中心集合x中的点q1；
[0060]
步骤4.4，重新计算虚拟候选聚类中心集合x中每个中心点到虚拟候选聚类中心集合x中其他所有中心点的距离之和，将距离之和排序，选择距离之和最小的中心点，表示为点q2；
[0061]
然后，将点q2放入集合set，并删除虚拟候选聚类中心集合x中的点q2；
[0062]
步骤4.3和步骤4.4的原理为：
[0063]
例如，如果不存在漏脉冲和测量误差，一共有两个雷达字，分别为：雷达字a＝p1,p2,...,p
20
；雷达字b＝p
30
,p
31
,...,p
50
；其中，p1,p2,...,p
20
为连续样本序列，p
30
,p
31
,...,p
50
为连续样本序列；
[0064]
当存在漏脉冲时，假设样本p
10
p
11
p
40
p
41
p
42
丢失，则侦收脉冲序列为：p1,p2,...,p9,p
12
,...,p
20
,p
30
,p
31
,...,p
39
,p
43
,...,p
50
。经过密度聚类后，假设得到4个簇，分别为：c1＝{p1,p2,...,p9}，c2＝{p
12
,...,p
20
}，c3＝{p
30
,p
31
,...,p
39
}，c4＝{p
43
,...,p
50
}。采用传统雷达字提取方法，则一共提取到4个雷达字，分别为：c1,c2,c3,c4；显示针对漏脉冲情况，具有雷达字提取准确率差的问题。
[0065]
而本发明中，预先设置需提取的雷达字个数为k＝2个；
[0066]
因此，首先算出c1＝{p1,p2,...,p9}的中心点x1，c2＝{p
12
,...,p
20
}的中心点x2，c3＝{p
30
,p
31
,...,p
39
}的中心点x3，c4＝{p
43
,...,p
50
}的中心点x4；由此得到虚拟候选聚类中心集合x＝{x1,x2,x3,x4}；计算x1,x2,x3,x4的中心点center；
[0067]
然后，分别计算中心点x1到中心点center的距离l1、中心点x2到中心点center的距离l2、中心点x3到中心点center的距离l3以及中心点x4到中心点center的距离l4，选择距离l1、l2、l3、l4中的最大距离，其对应的中心点即为点q1；此处，挑选距离最远的中心点作为点q1的原因为：挑选距离中心点center距离最远的点作为点q1，表明该中心点对应的簇与其他簇的距离均较远，说明该中心点对应的簇最有可能是连续脉冲，即：最有可能是没有发生漏脉冲的簇。
[0068]
然后，虚拟候选聚类中心集合x中剩余3个中心点，挑选与其他两个中心点距离之和最小的中心点，作为点q2，原因为：此时挑选的点q2，与前一步骤挑选的点q1的距离最远，表明其与点q1最有可能对应两个独立的雷达字。
[0069]
以挑选出的点q1和点q2作为初始聚类中心，进行聚类，可将簇c1和簇c2聚为一类，形成一个雷达字；将簇c3和簇c4聚为一类，形成一个雷达字；由此实现克服漏脉冲情况，准确提取到两个雷达字的优点。
[0070]
步骤4.5，返回步骤4.3，循环进行步骤4.3-步骤4.4，直至集合set中的元素个数达到预设置的雷达字个数k，以set集合中的k个元素作为初始聚类中心，对侦收脉冲标准化序列p
″
＝{p
″1，p
″2,...,p
″n}进行迭代聚类，得到k个簇，每个簇包括的标准化处理后的样本，按时间顺序排列，形成的标准化样本序列，即为提取到的一个雷达字，由此共提取到k个雷达字，即为提取到的非均衡样本的雷达字。
[0071]
因此，针对样本不均衡的侦收数据，本发明首次提出了此类情况下的雷达字提取方法，存在漏脉冲和测量误差的情形下较传统方法在提取准确率、f值和调整兰德系数等方面均有较大的提升，具有很强的鲁棒性。本发明通过迭代来达到簇合并目的的思想以及整
个雷达字提取的算法过程，属于本发明创新。
[0072]
为了进一步验证本发明提供的一种面向非均衡样本的雷达字提取方法的合理性与优越性，通过构建多个雷达字库进行仿真实验说明本技术的有益增益。
[0073]
首先仿真生成包含三部功能各异的多功能相控阵雷达的雷达字库，其中mpar-a是基于水星多功能雷达工作特性仿真生成的雷达字库，mpar-b和mpar-c分别是按照美海军an/spy-1雷达和mercury多功能雷达工作特性仿真生成的雷达字集。
[0074]
(1)雷达字提取性能对比
[0075]
侦收数据的不均衡，主要体现在两个方面：第一是侦察得到的mpar雷达字本身的各个雷达字密度不均衡，有的雷达字脉冲个数多，有的雷达字脉冲个数少；第二，由于敌方威胁目标本身正在执行功能的不确定性，造成其发射雷达字的密度不均衡。针对第一种情况选取mpar-c的雷达字集进行仿真实验，记为场景p；针对第二种情况选取mpar-c不同功能状态对应生成雷达字的脉冲序列进行仿真实验，假设经历如下的工作状态转换：四字搜索
→
四字搜索
→
三字搜索
→
捕获
→
非自适应跟踪
→
距离分辨(rr1)
→
距离分辨(rr2)
→
三字跟踪保持
→
三字跟踪保持，记为场景q。仿真实验设置脉冲随机丢失10％，测量误差随机上下浮动10％，针对场景p得到k-optics算法的可达图如图2所示；针对场景q的各算法的雷达字提取性能对比如表1所示。
[0076]
本技术的可达图不同于原本optics算法的可达图，图2展示的是将多余的簇进行合并之后的可达图，不同颜色代表一个簇。从图2中可以看出，针对场景p本发明所提k-optics算法能有效的将雷达字提取出来，对于非均衡样本具有很好的适应性，在迭代15次后提取转却率能达到94.21％，而同等条件下dbscan和optics算法只能达到90.90％和88.36％。
[0077]
表1展示的是在不同参数设置情况下传统密度聚类算法和本发明所提算法提取性能对比。
[0078]
表1聚类算法提取性能对比
[0079][0080]
从表1可以看出，本技术所提k-optics算法较传统的dbscan算法和optics算法性能有较大的提升：在领域半径为ε为0.1，点数阈值为3时，k-optics算法比其他算法的区别显著，无论是雷达字提取准确率、f值还是ari系数都要高出常规算法30个以上的百分点；另一方面，不同参数设置下k-optics算法雷达字提取准确率均能达到90％以上，说明本发明
算法对参数并不敏感，而dbscan算法在不同参数设置下提取效果差别很大，而在实战背景下非常注重时间效率，因此本技术所提算法不需要额外花费更多的时间寻找最优参数。
[0081]
(2)测量误差和漏脉冲对算法提取性能的影响
[0082]
通过采取控制变量法研究不同测量误差水平(error deviation level,edl)和漏脉冲对mpar雷达字提取效果的影响。首先控制edl均为10％，研究该情况下k-optics算法的提取准确率随脉冲丢失率(ratio of dropped pulses,rdp)变化趋势，每次仿真进行100次monte carlo实验避免偶然误差带来的影响，所得平均计算结果如图3所示；之后固定rdp为10％，每次仿真同样进行100次monte carlo实验，研究测量误差对k-optics算法提取准确率的影响，所得平均计算结果如图4所示。
[0083]
整体上看，随着edl和rdp的提升，本发明算法的提取性能逐渐变差，但是在rdp达到40％时仍具有85％以上的提取准确率、f值和ari值，说明本发明算法对漏脉冲具有很强的适应性；此外本发明算法在15％脉冲丢失率和15％测量误差水平复合情况下，提取准确率和f值达到85％以上，且ari系数较高，说明聚类结果与实际结果很相似，符合实际需求。
[0084]
以上所述仅是本发明的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视本发明的保护范围。

技术特征：
1.一种面向非均衡样本的雷达字提取方法，其特征在于，包括以下步骤：步骤1，接收待处理的侦收脉冲原始序列p＝{p1，p2，,...,p
n
}；其中，n代表侦收脉冲原始序列p的样本数量；p1，p2，,...,p
n
代表侦收脉冲原始序列p的第1个样本，第2个样本,...,第n个样本；对于任意第i个样本p
i
，为三维分量样本，表示为：p
i
＝{pri
i
,pw
i
,rf
i
}；其中，pri
i
代表脉冲重复间隔分量，pw
i
代表脉宽分量，rf
i
代表脉冲间载频分量；步骤2，样本标准化处理过程：对于侦收脉冲原始序列p的每个原始分量序列，表示为：原始分量序列a＝{a1，a2，,...,a
n
}，其中，a代表pri分量、pw分量和rf分量中的任意分量，均进行标准化处理，得到标准化分量序列b＝{b1，b2，,...,b
n
}；三种分量的标准化分量序列，形成侦收脉冲标准化序列p
″
＝{p
″1，p
″2，,...,p
″
n
}；标准化处理方法为：步骤2.1，采用下式，计算原始分量序列a的均值步骤2.1，采用下式，计算原始分量序列a的均值其中：a
i
代表原始分量序列a的第i个样本分量；步骤2.2，采用下式，计算原始分量序列a的方差s：步骤2.3，采用下式，计算得到标准化分量序列中第i个样本分量b
i
：步骤3，密度聚类：对侦收脉冲标准化序列p
″
＝{p
″1，p
″2，,...,p
″
n
}进行密度聚类，得到j个雷达字簇，分别表示为c1,c2,...,c
j
；其中，对于第u个雷达字簇c
u
，u＝1，2,...,j，包含的样本个数为|c
u
|；步骤4，构建set集合：步骤4.1，对于第u个雷达字簇c
u
，采用下式，得到中心点的坐标，采用下式，得到中心点的坐标步骤4.2，由此得到j个中心点的坐标，表示为：形成虚拟候
选聚类中心集合步骤4.3，计算虚拟候选聚类中心集合x中所有中心点的中心center的坐标；然后，计算虚拟候选聚类中心集合x中每个中心点到中心center的距离并排序，选取距离中心center最远的中心点，表示为点q1；然后，将点q1放入集合set，并删除虚拟候选聚类中心集合x中的点q1；步骤4.4，重新计算虚拟候选聚类中心集合x中每个中心点到虚拟候选聚类中心集合x中其他所有中心点的距离之和，将距离之和排序，选择距离之和最小的中心点，表示为点q2；然后，将点q2放入集合set，并删除虚拟候选聚类中心集合x中的点q2；步骤4.5，返回步骤4.3，循环进行步骤4.3-步骤4.4，直至集合set中的元素个数达到预设置的雷达字个数k，以set集合中的k个元素作为初始聚类中心，对侦收脉冲标准化序列p
″
＝{p
″1，p
″2，,...,p
″
n
}进行迭代聚类，得到k个簇，每个簇包括的标准化处理后的样本，按时间顺序排列，形成的标准化样本序列，即为提取到的一个雷达字，由此共提取到k个雷达字，即为提取到的非均衡样本的雷达字。2.根据权利要求1所述的面向非均衡样本的雷达字提取方法，其特征在于，步骤3中，采用的密度聚类为optics密度聚类算法。

技术总结
本发明提供一种面向非均衡样本的雷达字提取方法，包括以下步骤：接收待处理的侦收脉冲原始序列；样本标准化处理过程；密度聚类；构建SET集合；得到的聚类结果，即为提取到的非均衡样本的雷达字。针对样本不均衡的侦收数据，本发明首次提出了此类情况下的雷达字提取方法，存在漏脉冲和测量误差的情形下较传统方法在提取准确率、F值和调整兰德系数等方面均有较大的提升，具有很强的鲁棒性。具有很强的鲁棒性。具有很强的鲁棒性。

技术研发人员：高天昊曲卫邱磊王鹏达董尧尧姜浩浩
受保护的技术使用者：中国人民解放军战略支援部队航天工程大学
技术研发日：2022.03.30
技术公布日：2022/7/5

转载请注明原文地址: https://www.8miu.com/read-2663.html

专利

最新回复(0)