一种正则表达式的自动化生成方法、装置及存储介质与流程

allin2026-02-26 37

本发明涉及数据安全与api应用安全，尤其涉及一种正则表达式的自动化生成方法、装置及存储介质。

背景技术：

1、随着信息技术的发展和数字化转型的加速，应用程序接口（api）已成为现代数据交换的核心通道，然而，在这一进程中，api数据的安全保护措施并未同步跟上发展的步伐，目前的技术方案大多集中在数据库层面的数据安全保障上，在api层面的数据处理与保护方面，尤其是数据在传输过程中的安全问题，仍显不足。

2、在现有技术中，为了确保数据通过api传输的安全性，通常依靠人工编写复杂的正则表达式来对数据进行过滤和验证，这种方法不仅效率较低，而且容易出现人为错误，尤其是在面对日益复杂和不断变化的数据环境时，其局限性更为明显。

3、即传统的手工方式已经难以满足高效准确地对数据进行分类分级的需求，更无法灵活适应多样化的数据安全要求，因此，开发一种能够根据数据的敏感性和重要性自动进行智能分类分级，并能够自动生成精确匹配所需正则表达式的系统或方法，成为了提升api数据安全性的重要研究方向和技术挑战。

技术实现思路

1、本发明的目的在于提供一种正则表达式的自动化生成方法、装置及存储介质，以解决现有技术中在api数据传输时没有对api数据进行分级且不能为其自动生成匹配的正则表达式带来的低效率及低安全问题。

2、为实现上述目的，本申请采用以下技术方案：

3、本申请的一种正则表达式的自动化生成方法，包括以下步骤：

4、获取应用程序接口的样本响应数据，并根据预设的分级规则对所述样本响应数据进行分级处理得到样本分级结果集；

5、基于所述样本分级结果集随机生成与所述分级规则相对应的初始正则表达式集，并利用模拟退火算法对所述初始正则表达式集进行优化得到目标正则表达式集；

6、获取所述应用程序接口的最新响应数据，并根据所述目标正则表达式集确定所述最新响应数据的最终分级级别。

7、作为优选，所述获取应用程序接口的样本响应数据，包括：

8、获取应用程序接口的样本响应报文，并根据其数据格式解析所述样本响应报文得到样本响应数据。

9、作为优选，所述分级规则包括敏感数据识别规则和重要性分级标准。

10、作为优选，所述根据预设的分级规则对所述样本响应数据进行分级处理得到样本分级结果集，包括：

11、利用所述敏感数据识别规则识别出所述样本响应数据中所有的敏感数据；

12、将各个敏感数据分别与所述重要性分级标准进行匹配得到每个敏感数据的重要性级别；

13、根据所述重要性级别生成样本分级结果集。

14、作为优选，所述初始正则表达式集包含所述分级规则中每个分级级别对应的初始正则表达式，每个所述初始正则表达式中均包含敏感数据的关键特征。

15、作为优选，所述利用模拟退火算法对所述初始正则表达式集进行优化得到目标正则表达式集，包括：

16、设置模拟退火算法的初始温度、终止温度、冷却率和最大迭代次数；

17、选取所述初始正则表达式集中最优的一组初始正则表达式作为当前最优正则表达式集，并计算所述当前最优正则表达式集的适应度；

18、根据所述冷却率和初始温度计算当前温度，并比较所述当前温度和终止温度以及当前迭代次数和所述最大迭代次数；

19、于所述当前温度高于所述终止温度且所述当前迭代次数小于所述最大迭代次数时，根据扰动策略计算新最优正则表达式集及其适应度；

20、根据所述当前最优正则表达式集的适应度和所述新最优正则表达式集的适应度计算适应度增量；

21、于所述适应度增量大于零时，接受所述新最优正则表达式集，否则，根据所述初始温度和适应度增量确定接受所述新最优正则表达式集的概率；

22、重复上述步骤，直至温度降到所述终止温度或达到最大迭代次数，返回最新的最优正则表达式集作为目标正则表达式集。

23、作为优选，所述根据所述目标正则表达式集确定所述最新响应数据的最终分级级别，包括：

24、从所述目标正则表达式集中随机选取一目标正则表达式，并将其与所述最新响应数据进行匹配；

25、于匹配成功时，将其对应的分级级别作为所述最新响应数据的初始分级级别；

26、于匹配不成功时，选取下一目标正则表达式与所述最新响应数据进行匹配，直至确定所述最新响应数据的初始分级级别。

27、作为优选，所述方法还包括：

28、确定所述最新响应数据的初始分级级别后，将所述目标正则表达式集中的其他目标正则表达式依次与所述最新响应数据进行匹配；

29、若新的目标正则表达式匹配成功且其对应的分级级别高于所述最新响应数据的初始分级级别，则将所述最新响应数据的初始分级级别更新为所述新的目标正则表达式对应的分级级别，并继续使用所述目标正则表达式集中剩余的目标正则表达式进行匹配，直至遍历完所述目标正则表达式集，将最后更新的分级级别作为所述最新响应数据的最终分级级别。

30、一种正则表达式的自动化生成装置，包括：

31、分级模块，用于获取应用程序接口的样本响应数据，并根据预设的分级规则对所述样本响应数据进行分级处理得到样本分级结果集；

32、优化模块，用于基于所述样本分级结果集随机生成与所述分级规则相对应的初始正则表达式集，并利用模拟退火算法对所述初始正则表达式集进行优化得到目标正则表达式集；

33、匹配模块，用于获取所述应用程序接口的最新响应数据，并根据所述目标正则表达式集确定所述最新响应数据的最终分级级别。

34、一种存储有计算机程序的计算机可读存储介质，所述计算机程序使计算机执行时实现如上述中任一项所述的一种正则表达式的自动化生成方法。

35、本申请具有如下有益效果：

36、通过引入数据分类分级理念与模拟退火算法，实现了对api响应数据的智能分类与正则表达式的自动化生成与优化，不仅显著提高了正则表达式编写的效率和准确性，降低了人工干预的成本和风险，还能够根据数据的敏感性和重要性动态调整匹配策略，为api数据安全保护提供了更为精细和灵活的技术支持，此外，通过api响应的实时解析与匹配，本申请还能够及时发现并应对潜在的安全威胁，增强api应用的整体安全性。

技术特征：

1.一种正则表达式的自动化生成方法，其特征在于，包括以下步骤：

2.根据权利要求1所述的一种正则表达式的自动化生成方法，其特征在于，所述获取应用程序接口的样本响应数据，包括：

3.根据权利要求1所述的一种正则表达式的自动化生成方法，其特征在于，所述分级规则包括敏感数据识别规则和重要性分级标准。

4.根据权利要求3所述的一种正则表达式的自动化生成方法，其特征在于，所述根据预设的分级规则对所述样本响应数据进行分级处理得到样本分级结果集，包括：

5.根据权利要求4所述的一种正则表达式的自动化生成方法，其特征在于，所述初始正则表达式集包含所述分级规则中每个分级级别对应的初始正则表达式，每个所述初始正则表达式中均包含敏感数据的关键特征。

6.根据权利要求5所述的一种正则表达式的自动化生成方法，其特征在于，所述利用模拟退火算法对所述初始正则表达式集进行优化得到目标正则表达式集，包括：

7.根据权利要求1所述的一种正则表达式的自动化生成方法，其特征在于，所述根据所述目标正则表达式集确定所述最新响应数据的最终分级级别，包括：

8.根据权利要求7所述的一种正则表达式的自动化生成方法，其特征在于，所述方法还包括：

9.一种正则表达式的自动化生成装置，其特征在于，包括：

10.一种存储有计算机程序的计算机可读存储介质，其特征在于，所述计算机程序使计算机执行时实现如权利要求1～8中任一项所述的一种正则表达式的自动化生成方法。

技术总结
本发明公开了一种正则表达式的自动化生成方法、装置及存储介质，属于数据安全与API应用安全技术领域，包括以下步骤：获取应用程序接口的样本响应数据，并根据预设的分级规则对样本响应数据进行分级处理得到样本分级结果集；基于样本分级结果集随机生成与分级规则相对应的初始正则表达式集，并利用模拟退火算法对初始正则表达式集进行优化得到目标正则表达式集；获取应用程序接口的最新响应数据，并根据目标正则表达式集确定最新响应数据的最终分级级别。本申请通过引入数据分类分级理念与模拟退火算法，实现了对API响应数据的智能分类与正则表达式的自动化生成与优化，为API数据安全保护提供了更为精细和灵活的技术支持。

技术研发人员：刘传兴,李清,季敏敏,南豪妮,汪利辉,聂万泉,魏兴国
受保护的技术使用者：杭州默安科技有限公司
技术研发日：
技术公布日：2024/10/31

转载请注明原文地址: https://www.8miu.com/read-26958.html

专利

最新回复(0)