一种域名生成和识别方法、装置、设备及介质与流程

allin2022-07-27  171



1.本技术涉及一种网络安全技术领域,尤其涉及一种域名生成和识别方法、装置、设备及介质。


背景技术:

2.相关技术中,一些钓鱼网站的域名一般会采用对其仿冒的合法域名中所包含的字符的位置进行微调的方式,仿冒该合法域名,即采用合法域名对应的近似域名,从而实现诱导用户访问,从而获取访问的用户的秘密信息(如银行卡的卡号和口令、电子邮箱口令等)。为了保护用户的信息安全,可以将获取到的待检测域名与预先收集到的违规域名(如钓鱼网站的域名)进行匹配,从而确定待检测域名是否为违规域名。由于可以收集到的违规域名是有限的,无法将待检测域名与所有的违规域名进行匹配,造成获取到的识别结果可能是不准确的。
3.因此,如何获取到大量仿冒该待保护域名的近似域名是一个亟待解决的问题。


技术实现要素:

4.本技术实施例提供了一种域名生成和识别方法、装置、设备及介质,用以解决现有无法获取到大量仿冒待保护域名的近似域名。
5.本技术实施例提供了一种域名生成方法,所述方法还包括:
6.获取待保护域名中包含的核心字符串;其中,所述核心字符串用于唯一标识所述待保护域名;
7.通过预设的域名变形规则,获取所述核心字符串对应的近似字符串;其中,所述域名变形规则用于对所述核心字符串中包含的字符进行变换。
8.本技术实施例提供了一种域名识别方法,所述方法包括:
9.获取待检测域名中包含的核心字符串;其中,所述核心字符串用于唯一标识所述待检测域名;
10.将所述核心字符串与预先保存的近似字符串进行匹配;其中,所述近似字符串是通过预设的域名变形规则生成的;
11.若确定存在匹配的近似字符串,则确定所述待检测域名为违规域名;
12.若确定不存在匹配的近似字符串,确定所述待检测域名为合规域名。
13.本技术实施例提供了一种域名生成装置,所述装置包括:
14.获取模块,用于获取待保护域名中包含的核心字符串;其中,所述核心字符串用于唯一标识所述待保护域名;
15.处理模块,用于通过预设的域名变形规则,获取所述核心字符串对应的近似字符串;其中,所述域名变形规则用于对所述核心字符串中包含的字符进行变换。
16.本技术实施例提供了一种域名识别装置,所述装置包括:
17.获取单元,用于获取待检测域名中包含的核心字符串;其中,所述核心字符串用于
唯一标识所述待检测域名;
18.匹配单元,用于将所述核心字符串与预先保存的近似字符串进行匹配;其中,所述近似字符串是通过预设的域名变形规则生成的;
19.确定单元,用于若所述匹配单元确定存在匹配的近似字符串,则确定所述待检测域名为违规域名;若所述匹配单元确定不存在匹配的近似字符串,确定所述待检测域名为合规域名。
20.本技术实施例提供了一种电子设备,所述电子设备至少包括处理器和存储器,所述处理器用于执行存储器中存储的计算机程序时实现如上述所述域名生成方法的步骤,或实现如上述所述域名识别方法的步骤。
21.本技术实施例提供了一种计算机可读存储介质,其存储有计算机程序,所述计算机程序被处理器执行时实现如上述所述域名生成方法的步骤,或实现如上述所述域名识别方法的步骤。
22.由于预先配置有域名变形规则,使得根据该域名变形规则,可以对待保护域名中包含的核心字符串进行变换,从而获取到核心字符串对应的近似字符串,进而根据获取到的近似字符串,确定待保护域名对应的近似域名,从而实现尽可能地获取到所有可能仿冒待保护域名对应的近似域名,无需通过收集的方式获取待保护域名对应的近似域名,极大地减少了获取待保护域名对应的近似域名所需的工作量以及耗费的成本。
附图说明
23.为了更清楚地说明本技术实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简要介绍,显而易见地,下面描述中的附图仅仅是本技术的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
24.图1为本技术实施例提供的一种域名生成过程示意图;
25.图2为本技术实施例提供的具体的域名生成流程示意图;
26.图3为本技术实施例提供的一种域名识别过程示意图;
27.图4为本技术实施例提供的具体的域名识别流程示意图;
28.图5为本技术实施例提供的一种域名生成装置的结构示意图;
29.图6为本技术实施例提供的一种域名识别装置的结构示意图;
30.图7为本技术实施例提供的一种电子设备的结构示意图;
31.图8为本技术实施例提供的再一种电子设备的结构示意图。
具体实施方式
32.下面将结合附图对本技术作进一步地详细描述,显然,所描述的实施例仅仅是本技术一部分实施例,而不是全部的实施例。基于本技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本技术保护的范围。
33.本领域技术人员知道,本技术的实施方式可以实现为一种系统、装置、设备、方法或计算机程序产品。因此,本技术可以具体实现为以下形式,即:完全的硬件、完全的软件(包括固件、驻留软件、微代码等),或者硬件和软件结合的形式。
34.在本文中,需要理解的是,附图中的任何元素数量均用于示例而非限制,以及任何命名都仅用于区分,而不具有任何限制含义。
35.为了方便理解,下面对本技术实施例中涉及的部分概念进行解释:
36.钓鱼网站:钓鱼网站是指欺骗用户的虚假网站。“钓鱼网站”的页面与真实网站界面基本一致,欺骗消费者或者窃取访问者提交的账号和密码信息。钓鱼网站一般只有一个或几个页面,和真实网站差别细微。
37.近似域名:指域名的长度、字符形状、字符顺序等十分相似的域名。
38.在实际应用过程中,“钓鱼网站”是随着网络普及和在线交易增加而变得异常猖獗的网络诈骗行为。通常与银行网站或其他知名网站几乎完全相同,从而引诱用户提交敏感信息。钓鱼者通过窃取到的个人信息,可仿冒受害者进行欺诈金融交易,甚至利用个人信息进行其他非法活动。所以想要避免产生更多的损失,保护用户安全上网、净化网络空间,就必须研究更加高效、可靠的钓鱼网站检测技术。
39.相关技术,一般通过收集的方式,获取大量的违规域名,以使得后续可以将待检测域名与预先收集的违规域名进行匹配,从而确定待检测域名是否为违规域名。但由于可以收集到的违规域名是有限的,无法将待检测域名与所有的违规域名进行匹配,从而造成获取到的识别结果可能是不准确的。
40.为了解决的问题,本技术一种域名生成和识别方法、装置、设备及介质。由于预先配置有域名变形规则,使得根据该域名变形规则,可以对待保护域名中包含的核心字符串进行变换,从而获取到核心字符串对应的近似字符串,进而根据获取到的近似字符串,确定待保护域名对应的近似域名,从而实现尽可能地获取到所有可能仿冒待保护域名对应的近似域名,无需通过收集的方式获取待保护域名对应的近似域名,极大地减少了获取待保护域名对应的近似域名所需的工作量以及耗费的成本。
41.为便于理解本技术实施例,上述对本技术的应用场景进行介绍,本技术实施例描述的业务场景是为了更加清楚的说明本技术实施例的技术方案,并不构成对于本技术实施例提供的技术方案的限定,本领域普通技术人员可知,随着新业务场景的出现,本技术实施例提供的技术方案对于类似的技术问题,同样适用。比如,域名的产权保护、域名的侵权查询等场景均可适用本技术提供的技术方案。
42.实施例1:
43.图1为本技术实施例提供的一种域名生成过程示意图,该过程包括:
44.s101:获取待保护域名中包含的核心字符串;其中,所述核心字符串用于唯一标识所述待保护域名。
45.本技术实施例提供的域名生成方法应用于电子设备(为了方便描述,记为域名生成设备),该域名生成设备可以是如移动终端、电脑等智能设备,也可以是服务器,比如,应用服务器等。
46.在实际应用场景中,进行域名生成的电子设备接收到生成某一域名对应的近似域名的处理请求后,便将该域名确定为待保护域名,并基于该待保护域名,采用本技术提供的域名生成方法,进行相应的处理,从而确定该待保护域名对应的近似域名。
47.其中,进行域名生成的电子设备接收到处理请求,主要包括以下至少一种情况:
48.情况一、当工作人员需要收集至少一个域名分别对应的近似域名时,可以向智能
设备输入业务处理请求,智能设备接收到对该至少一个域名的业务处理请求后,便可以向进行域名生成的电子设备发送生成该至少一个域名分别对应的近似域名的处理请求。
49.情况二、当智能设备检测到工作人员输入某一域名时,也可以主动生成该域名的处理请求并发送至进行域名生成的电子设备。
50.需要说明的是,进行域名生成的电子设备可以与该智能设备相同,也可以不同。
51.在本技术中,核心字符串表征待保护域名包含的字符串中,可以唯一标识该待保护域名的字符串。
52.其中,该待保护域名中包含的核心字符串可以是待保护域名其本身,也可以是该待保护域名包含的部分字符串。
53.在一种示例中,所述获取待保护域名中包含的核心字符串,包括:
54.按照预设的划分方式,将所述待保护域名划分为多段字符串;
55.确定所述多段字符串中非顶级域名的每个目标字符串;
56.将所述每个目标字符串与保存的通用字符串进行匹配;
57.将所述目标字符串中,不存在匹配的通用字符串的目标字符串确定为所述核心字符串。
58.一般情况下,域名的域名空间是由多个部分构成的,且每个部分是通过“.”符号进行分隔的。比如,对于域名www.nsfocus.com,该域名中的顶级域名为com,二级域名为nsfocus.com,三级域名为www.nsfocus.com。其中,该域名中最右侧部分为该域名的顶级域名。违规域名包含的顶级域名一般与合法域名中包含的顶级域名相同,且违规域名一般是对合法域名中非顶级域名的部分进行微调,从而实现仿冒合法域名的。因此,在本技术中,可以根据收集到的合法域名所包含的字符串,确定通用字符串,从而方便后续获取到待保护域名后,电子设备可以基于预先保存的通用字符串,对该待保护域名所包含的各个部分进行识别并分析,从而获取该待保护域名中包含的核心字符串。
59.其中,可以根据合法域名中的二级域名,确定通用字符串。例如,edu(用于教育机构)、com(用于商业公司)、net(用于网络服务)、org(用于组织协会)、gov(用于政府部门)、mil(用于军事领域)、以及int(用于国际组织)。
60.示例性的,可以按照预设的划分方式,对该待保护域名进行划分,即将该待保护域名划分为多段字符串。例如,确定待保护域名中包含的每个分隔符以及每个分隔符的位置,基于每个分隔符以及每个分隔符的位置,对待保护域名进行划分,从而获取该待保护域名中包含的多段字符串。根据该多段字符串在待保护域名中的位置,确定该待保护域名中包含的顶级域名。比如,合法域名包含的顶级域名一般位于合法域名的最右侧分隔符的右侧。将该多段字符串中非顶级域名的字符串,确定为目标字符串。针对每个目标字符串,将该目标字符串与预先保存的通用字符串进行匹配。若确定该目标字符串与每个通用字符串均不匹配,说明该字符串极有可能不是合法域名中所包含的字符串,则将该目标字符串确定为核心字符串;若确定该目标字符串与任一通用字符串匹配,说明该字符串是合法域名中所包含的字符串,则获取下一目标字符串。
61.其中,可以按照每个目标字符串分别在该待保护域名中从右到左的顺序,依次将每个目标字符串与预先保存的通用字符串进行匹配。
62.例如,对待保护域名www.nsfocus.com进行识别时,获取该待保护域名
www.nsfocus.com中包含的每个分隔符“.”以及每个分隔符

.’在待保护域名中的位置。根据每个分隔符“.”以及每个分隔符

.’在待保护域名中的位置,对该待保护域名划分,获取该待保护域名划分为三段字符串,分别为www、nsfocus和com。根据该多段字符串在待保护域名中的位置,确定该待保护域名中包含的顶级域名为com。将该多段字符串中非顶级域名的字符串www和nsfocus确定为目标字符串。针对每个目标字符串,将该目标字符串与预先保存的通用字符串进行匹配。若确定该目标字符串与每个通用字符串均不匹配,说明该字符串极有可能不是合法域名中所包含的字符串,则将该目标字符串确定为核心字符串;若确定该目标字符串与任一通用字符串匹配,说明该字符串是合法域名中所包含的字符串,则获取下一目标字符串。
63.s102:通过预设的域名变形规则,获取所述核心字符串对应的近似字符串;其中,所述域名变形规则用于对所述核心字符串中包含的字符进行变换。
64.由于无法收集到市面上所有违规域名,从而无法准确地对待保护域名进行保护。因此,在本技术中,预先配置有域名变形规则,以通过该域名变形规则生成待保护域名中包含的核心字符串对应的近似字符串,实现对现有的违规域名进行拓展,从而尽可能地获取到所有可能仿冒待保护域名的近似域名,并将生成的近似域名保存,以方便后续将待保护域名与保存的近似域名进行匹配的匹配结果的准确性。
65.在一种示例中,通过如下三种方式实现基于预先配置的域名变形规则,生成近似字符串:
66.方式一、考虑到现有的违规域名,一般会采用对其仿冒的合法域名中所包含的字符的位置进行微调的方式,仿冒该合法域名。因此,在本技术中,可以将核心字符串中包含的每个字符重新排序,确定所有排列组合,并根据获取到的所有排列组合,确定该核心字符串对应的至少一个近似字符串。
67.在一种示例中,可以确定获取到的所有排列组合中,与该核心字符串对应的排列组合不同的其它排列组合,并将至少一个其它排列组合确定为该核心字符串对应的近似字符串。
68.在另一种示例中,可以对获取到的所有排列组合进行去重处理,并从去重处理后的所有排列组合中,删除与该核心字符串对应的排列组合相同的排列组合,将剩下的所有排列组合确定为该核心字符串对应的近似字符串;或,确定获取到的所有排列组合中,与该核心字符串对应的排列组合不同的其它排列组合,并对所有其它排列组合进行去重处理,将去重处理后的其它排列组合确定为该核心字符串对应的近似字符串。
69.例如,核心字符串为www.nsfocus,该核心字符串对应的近似字符串为www.nsfoucs。
70.再例如,假设核心字符串为nsfocus,获取该核心字符串中包含的每个字符,并通过下表进行表示:
71.1234567nsfocus
72.对于这7个字符,每个字符可以出现在任意一个位置,获取这7个字符所构成的所有排列组合。对获取到的所有排列组合进行去重处理,并删除与该核心字符串对应的排列组合相同的排列组合,即可获取到该核心字符串对应的至少一个近似字符串。
73.假设任一核心字符串包含有m个字符,对这m个字符进行排序,获取到该核心字符串对应有个排列组合。其中,获取到的所有排序组合中包含有b个重复的排序组合,则该核心字符串对应的至少一个近似字符串有个。
74.方式二、考虑到现有的违规域名,会采用对其仿冒的合法域名中所包含的字符进行替换。因此,在本技术中,预先针对不同的字符,配置有该字符所对应的替换字符,其中,该替换字符与该字符形似。例如,下表可表示预先配置的字符与替换字符的对应关系:
75.字符替换字符b6,h,dc0,odb,6g8s5o0,coq,o,0
76.具体实施过程中,针对每个字符串,根据预先配置的字符与替换字符的对应关系,确定该字符串包含的每个字符分别对应的替换字符;其中,所述字符串包括以下中的一项或多项:该核心字符串、以及该核心字符串对应的近似字符串;根据每个字符分别对应的替换字符,获取该字符串对应的至少一个替换字符串;其中,该替换字符串是通过对该字符串中包含的至少一个字符进行替换获取到的。将获取到的至少一个替换字符串,确定为该核心字符串对应的近似字符串。
77.例如,字符串为www.nsfocus,确定o(小写)对应的替换字符有o(大写)和0,则根据该o对应的替换字符,该字符串对应的近似字符串为www.nsf0ucs和www.nsfoucs。
78.假设任一字符串包含有m个字符,确定该m个字符分别对应的替换字符,每个字符分别对应有c个替换字符。根据每个字符分别对应的替换字符,对该字符串对应的lk个替换字符串。其中,可通过如下公式确定lk:
79.lk=c
1k
×c2k
×c3k
×…×cmk
80.其中,c
mk
表示第m个字符所对应的替换字符,lk表示第k个字符串。
81.方式三、考虑到现有的违规域名,会采用对其仿冒的合法域名中添加字符串的方式,从而实现仿冒该合法域名。因此,在本技术中,预先配置有至少一个附加字符串,比如“_”、“0
‑”
等。其中,该附加字符串可以是前缀字符串,也可以是后缀字符串等。例如,下表可表示预先配置的附加字符串:
82.前缀字符串后缀字符串my,my-0到1数字,-0,-1,-2i,i
‑‑
on,onblog,blog
‑‑
cn,-combank,bank-er
83.具体实施过程中,针对每个字符串,将预先配置的附加字符串添加到该字符串中;将添加后的字符串,确定为核心字符串对应的近似字符串。
84.需要说的是,该字符串可以是核心字符串,也可以是基于上述的至少一种方式获取到的近似字符串,比如,基于方式一获取到的近似字符串,基于方式一和方式二获取到的近似字符串等。
85.例如,字符串为www.nsfocus,在该字符串中,添加前缀字符串my,则该字符串对应的近似字符串为www.mynsfocus。
86.在一种示例中,上述用于生成近似字符串的至少两个方式可以相互结合,比如可以同时采用方式一和方式二,生成近似字符串,或同时采用方式一、方式二和方式三,生成近似字符串等,且任一方式可以在之前生成的近似字符串的基础上继续扩展,比如在方式一生成的近似字符串的基础上,采用方式二继续生成近似字符串,然后采用方式三继续生成近似字符串等。
87.考虑到基于上述实施例获取到近似字符串中,可能存在重复的近似字符串,则可以在获取到近似字符串后,对近似字符串进行去重处理,并删除与该核心字符串相同的近似字符串,从而节省保存大量重复的近似字符串所耗费的存储空间,以及后续将核心字符串与重复的近似字符串进行匹配所浪费的计算量。
88.由于预先配置有域名变形规则,使得根据该域名变形规则,可以对待保护域名中包含的核心字符串进行变换,从而获取到核心字符串对应的近似字符串,进而根据获取到的近似字符串,确定待保护域名对应的近似域名,从而实现尽可能地获取到所有可能仿冒待保护域名对应的近似域名,无需通过收集的方式获取待保护域名对应的近似域名,极大地减少了获取待保护域名对应的近似域名所需的工作量以及耗费的成本。
89.实施例2:
90.下面通过具体的实施例对本技术提供的域名生成方法进行说明,图2为本技术实施例提供的具体的域名生成流程示意图,该流程包括:
91.s201:获取待保护域名。
92.s202:按照预设的划分方式,将该待保护域名划分为多段字符串。
93.s203:确定该多段字符串中非顶级域名的每个目标字符串。
94.s204:将每个目标字符串与保存的通用字符串进行匹配,并将该目标字符串中,不存在匹配的通用字符串的目标字符串确定为核心字符串。
95.s205:通过预设的域名变形规则,获取该核心字符串对应的近似字符串。
96.在一种示例中,通过如下至少一种方式通过预设的域名变形规则,生成近似字符串:
97.方式一、针对保存的每个核心字符串,将该核心字符串中包含的每个字符重新排序,确定所有排列组合;其中,核心字符串用于标识合法域名;根据所有排列组合,确定该核心字符串对应的至少一个近似字符串。
98.假设任一核心字符串包含有m个字符,对这m个字符进行排序,获取到该核心字符串对应有个排列组合。其中,获取到的所有排序组合中包含有b个重复的排序组合,则该核心字符串对应的至少一个近似字符串有个。
99.方式二、针对每个字符串,根据预先配置的字符与替换字符的对应关系,确定该字符串包含的每个字符分别对应的替换字符;其中,字符串包括以下中的一项或多项:核心字
符串、以及核心字符串对应的至少一个近似字符串;按照每个字符在该字符串中的顺序,将每个字符分别对应的替换字符进行组合;根据各个组合,确定该字符串对应的至少一个近似字符串。
100.仍以上述为例,通过方式一可以获取到个字符串,对于该个字符串,采用方式二进行进一步的处理。假设任一字符串包含有m个字符,确定该m个字符分别对应的替换字符,每个字符分别对应有c个替换字符。按照该m个字符在该字符串中的顺序,将该m个字符分别对应的替换字符进行组合,则可以获取到该字符串对应的lk个组合。通过该方式二,可以获取到z个近似字符串。
101.其中,可通过如下公式确定z:
[0102][0103]
lk=c
1k
×c2k
×c3k
×…×cmk

[0104]
其中,z表示获取到的近似字符串的总数,cm表示第k个字符串中包含的第m个字符所对应的替换字符,lk表示第k个字符串。
[0105]
方式三、针对当前获取到的每个字符串,将预先配置的附加字符串添加到该字符串中;根据添加后的字符串,确定该字符串对应的近似字符串。
[0106]
需要说的是,该字符串可以是核心字符串,也可以是基于上述的至少一种方式获取到的近似字符串,比如,基于方式一获取到的近似字符串,基于方式一和方式二获取到的近似字符串等。
[0107]
任以上述为例,假设每个字符串均对应有s个近似字符串,则在方式二获取到的字符串的基础上,可以获取到z*s-1个近似字符串,从而实现获取到大量的近似字符串,即获取到大量的违规域名的字符串。
[0108]
在一种示例中,上述用于生成近似字符串的至少两个方式可以相互结合,比如可以同时采用方式一和方式二,生成近似字符串,或同时采用方式一、方式二和方式三,生成近似字符串等,且任一方式可以在之前生成的近似字符串的基础上继续扩展,比如在方式一生成的近似字符串的基础上,采用方式二继续生成近似字符串,然后采用方式三继续生成近似字符串等。
[0109]
s206:对获取到的近似字符串进行去重处理,并删除与该核心字符串相同的近似字符串。
[0110]
实施例3:
[0111]
本技术提供了一种域名识别方法,图3为本技术实施例提供的一种域名识别过程示意图,该过程包括:
[0112]
s301:获取待检测域名中包含的核心字符串;其中,所述核心字符串用于唯一标识所述待检测域名。
[0113]
本技术实施例提供的域名识别方法应用于电子设备(为了方便描述,记为域名识别设备),该域名识别设备可以是如移动终端、电脑等智能设备,也可以是服务器,比如,应用服务器等。
[0114]
域名识别设备可以与上述的域名生成设备相同,也可以不相同。
[0115]
需要说明的是,获取待检测域名中包含的核心字符串的过程与上述获取待保护域
名中包含的核心字符串的过程相同,重复之处不做赘述。
[0116]
s302:将所述核心字符串与预先保存的近似字符串进行匹配;其中,所述近似字符串是通过预设的域名变形规则生成的。
[0117]
需要说明的是,近似字符串的获取方法已在上述实施例中进行说明,在此不做赘述。
[0118]
s303:若确定存在匹配的近似字符串,则确定所述待检测域名为违规域名。
[0119]
s304:若确定不存在匹配的近似字符串,确定所述待检测域名为合规域名。
[0120]
在一种可能的应用场景中,基于上述的实施例获取到近似字符串之后,获取到的近似字符串可用于违规域名识别的场景中。示例性的,获取到待检测域名后,确定该待检测域名中包含的核心字符串。然后将该核心字符串与保存的每个近似字符串进行匹配,从而确定该待保护域名是否为违规域名。
[0121]
具体的,可以针对每个近似字符串,确定该近似字符串与该核心字符串之间的相似度,若确定该相似度大于预设的相似度阈值,则确定该核心字符串与该近似字符串比较相似,即确定该核心字符串存在匹配的近似字符串。若确定该相似度不大于预设的相似度阈值,则确定该核心字符串与该近似字符串不相似,即确定该核心字符串与该近似字符串不匹配。
[0122]
其中,该相似度可以是余弦相似度、余弦距离、欧式距离等方式进行表示。
[0123]
当确定该核心字符串存在匹配的近似字符串,则确定该待检测域名为违规域名。当确定该核心字符串与每个近似字符串均不匹配,即不存在与该核心字符串匹配的近似字符串,则确定该待检测域名为合规域名。
[0124]
在一种示例中,当确定不存在与该核心字符串匹配的近似字符串后,可以输出对该近似字符串进行人工复检的提示信息,从而尽可能避免用户访问到违规域名,从而影响用户的财产安全。
[0125]
实施例4:
[0126]
下面通过具体的实施例对本技术提供的域名识别方法进行说明,图4为本技术实施例提供的具体的域名识别流程示意图,该流程包括:
[0127]
s401:基于预先配置的违规域名生成规则,生成近似字符串。
[0128]
s402:获取待检测域名。
[0129]
s403:按照预设的划分方式,将待检测域名划分为多段字符串。
[0130]
s404:确定多段字符串中非顶级域名的每个目标字符串。
[0131]
s405:将每个目标字符串与保存的通用字符串进行匹配,并将目标字符串中,不存在匹配的通用字符串的目标字符串确定为核心字符串。
[0132]
s406:将核心字符串与保存的每个近似字符串进行匹配,并判断是否存在匹配的近似字符串,若是,执行s407,否则,执行s408。
[0133]
在一种示例中,可以通过核心字符串分别与每个近似字符串之间的相似度是否大于预设的阈值,确定是否存在与该核心字符串匹配的近似字符串。
[0134]
s407:确定待检测域名为违规域名。
[0135]
s408:确定待检测域名为合规域名。
[0136]
实施例5:
[0137]
本技术提供了一种域名生成装置,图5为本技术实施例提供的一种域名生成装置的结构示意图,该装置包括:
[0138]
获取模块51,用于获取待保护域名中包含的核心字符串;其中,所述核心字符串用于唯一标识所述待保护域名;
[0139]
处理模块52,用于通过预设的域名变形规则,获取所述核心字符串对应的近似字符串;其中,所述域名变形规则用于对所述核心字符串中包含的字符进行变换。
[0140]
在某些可能的实施方式中,所述获取模块51,具体用于按照预设的划分方式,将所述待保护域名划分为多段字符串;确定所述多段字符串中非顶级域名的每个目标字符串;将所述每个目标字符串与保存的通用字符串进行匹配;将所述目标字符串中,不存在匹配的通用字符串的目标字符串确定为所述核心字符串。
[0141]
在某些可能的实施方式中,所述处理模块52,具体用于将所述核心字符串中包含的每个字符重新排序,确定所有排列组合;将所述所有排列组合,确定为所述核心字符串对应的近似字符串。
[0142]
在某些可能的实施方式中,所述处理模块52,具体用于针对每个字符串,根据预先配置的字符与替换字符的对应关系,确定该字符串包含的每个字符分别对应的替换字符;其中,所述字符串包括以下中的一项或多项:所述核心字符串、以及所述核心字符串对应的近似字符串;根据所述每个字符分别对应的替换字符,获取该字符串对应的至少一个替换字符串;其中,所述替换字符串是通过对该字符串中包含的至少一个字符进行替换获取到的;将所述至少一个替换字符串,确定为所述核心字符串对应的近似字符串。
[0143]
在某些可能的实施方式中,所述处理模块52,具体用于针对每个字符串,将预先配置的附加字符串添加到该第一字符串中;其中,所述字符串包括以下中的一项或多项:所述核心字符串、以及所述核心字符串对应的近似字符串;将添加后的字符串,确定为所述核心字符串对应的近似字符串。
[0144]
在某些可能的实施方式中,所述处理模块52,还用于对所述核心字符串对应的近似字符串进行去重处理。
[0145]
由于预先配置有域名变形规则,使得根据该域名变形规则,可以对待保护域名中包含的核心字符串进行变换,从而获取到核心字符串对应的近似字符串,进而根据获取到的近似字符串,确定待保护域名对应的近似域名,从而实现尽可能地获取到所有可能仿冒待保护域名对应的近似域名,无需通过收集的方式获取待保护域名对应的近似域名,极大地减少了获取待保护域名对应的近似域名所需的工作量以及耗费的成本。
[0146]
实施例6:
[0147]
本技术提供了一种域名识别装置,图6为本技术实施例提供的一种域名识别装置的结构示意图,该装置包括:
[0148]
获取单元61,用于获取待检测域名中包含的核心字符串;其中,所述核心字符串用于唯一标识所述待检测域名;
[0149]
匹配单元62,用于将所述核心字符串与预先保存的近似字符串进行匹配;其中,所述近似字符串是通过预设的域名变形规则生成的;
[0150]
确定单元63,用于若所述匹配单元32确定存在匹配的近似字符串,则确定所述待检测域名为违规域名;若所述匹配单元32确定不存在匹配的近似字符串,确定所述待检测
域名为合规域名。
[0151]
实施例7:
[0152]
如图7为本技术实施例提供的一种电子设备结构示意图,在上述各实施例的基础上,本技术实施例还提供了一种电子设备,如图7所示,包括:处理器71、通信接口72、存储器73和通信总线74,其中,处理器71,通信接口72,存储器73通过通信总线74完成相互间的通信;
[0153]
所述存储器73中存储有计算机程序,当所述程序被所述处理器71执行时,使得所述处理器71执行如下步骤:
[0154]
获取待保护域名中包含的核心字符串;其中,所述核心字符串用于唯一标识所述待保护域名;
[0155]
通过预设的域名变形规则,获取所述核心字符串对应的近似字符串;其中,所述域名变形规则用于对所述核心字符串中包含的字符进行变换。
[0156]
由于上述电子设备解决问题的原理与域名生成方法相似,因此上述电子设备的实施可以参见方法的实施例1-2,重复之处不再赘述。
[0157]
实施例8:
[0158]
如图8为本技术实施例提供的再一种电子设备结构示意图,在上述各实施例的基础上,本技术实施例还提供了一种电子设备,如图8所示,包括:处理器81、通信接口82、存储器83和通信总线84,其中,处理器81,通信接口82,存储器83通过通信总线84完成相互间的通信;
[0159]
所述存储器83中存储有计算机程序,当所述程序被所述处理器81执行时,使得所述处理器81执行如下步骤:
[0160]
获取待检测域名中包含的核心字符串;其中,所述核心字符串用于唯一标识所述待检测域名;
[0161]
将所述核心字符串与预先保存的近似字符串进行匹配;其中,所述近似字符串是通过预设的域名变形规则生成的;
[0162]
若确定存在匹配的近似字符串,则确定所述待检测域名为违规域名;
[0163]
若确定不存在匹配的近似字符串,确定所述待检测域名为合规域名。
[0164]
由于上述电子设备解决问题的原理与域名识别方法相似,因此上述电子设备的实施可以参见方法的实施例3-4,重复之处不再赘述。
[0165]
上述电子设备提到的通信总线可以是外设部件互连标准(peripheral component interconnect,pci)总线或扩展工业标准结构(extended industry standard architecture,eisa)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
[0166]
通信接口82用于上述电子设备与其他设备之间的通信。
[0167]
存储器可以包括随机存取存储器(random access memory,ram),也可以包括非易失性存储器(non-volatile memory,nvm),例如至少一个磁盘存储器。可选地,存储器还可以是至少一个位于远离前述处理器的存储装置。
[0168]
上述处理器可以是通用处理器,包括中央处理器、网络处理器(network processor,np)等;还可以是数字指令处理器(digital signal processing,dsp)、专用集
成电路、现场可编程门陈列或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。
[0169]
实施例9:
[0170]
在上述各实施例的基础上,本技术实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质内存储有可由处理器执行的计算机程序,当所述程序在所述处理器上运行时,使得所述处理器执行时实现如下步骤:
[0171]
获取待保护域名中包含的核心字符串;其中,所述核心字符串用于唯一标识所述待保护域名;
[0172]
通过预设的域名变形规则,获取所述核心字符串对应的近似字符串;其中,所述域名变形规则用于对所述核心字符串中包含的字符进行变换。
[0173]
由于上述计算机可读存储介质解决问题的原理与域名生成方法相似,因此上述计算机可读存储介质的实施可以参见方法的实施例1-2,重复之处不再赘述。
[0174]
实施例10:
[0175]
在上述各实施例的基础上,本技术实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质内存储有可由处理器执行的计算机程序,当所述程序在所述处理器上运行时,使得所述处理器执行时实现如下步骤:
[0176]
获取待检测域名中包含的核心字符串;其中,所述核心字符串用于唯一标识所述待检测域名;
[0177]
将所述核心字符串与预先保存的近似字符串进行匹配;其中,所述近似字符串是通过预设的域名变形规则生成的;
[0178]
若确定存在匹配的近似字符串,则确定所述待检测域名为违规域名;
[0179]
若确定不存在匹配的近似字符串,确定所述待检测域名为合规域名。
[0180]
由于上述计算机可读存储介质解决问题的原理与域名识别方法相似,因此上述计算机可读存储介质的实施可以参见方法的实施例3-4,重复之处不再赘述。
[0181]
本领域内的技术人员应明白,本技术的实施例可提供为方法、系统、或计算机程序产品。因此,本技术可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本技术可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。
[0182]
本技术是参照根据本技术的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
[0183]
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
[0184]
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
[0185]
显然,本领域的技术人员可以对本技术进行各种改动和变型而不脱离本技术的精神和范围。这样,倘若本技术的这些修改和变型属于本技术权利要求及其等同技术的范围之内,则本技术也意图包含这些改动和变型在内。

技术特征:
1.一种域名生成方法,其特征在于,所述方法还包括:获取待保护域名中包含的核心字符串;其中,所述核心字符串用于唯一标识所述待保护域名;通过预设的域名变形规则,获取所述核心字符串对应的近似字符串;其中,所述域名变形规则用于对所述核心字符串中包含的字符进行变换。2.根据权利要求1所述的方法,其特征在于,所述获取待保护域名中包含的核心字符串,包括:按照预设的划分方式,将所述待保护域名划分为多段字符串;确定所述多段字符串中非顶级域名的每个目标字符串;将所述每个目标字符串与保存的通用字符串进行匹配;将所述目标字符串中,不存在匹配的通用字符串的目标字符串确定为所述核心字符串。3.根据权利要求1所述的方法,其特征在于,所述通过预设的域名变形规则,获取所述核心字符串对应的近似字符串,包括:将所述核心字符串中包含的每个字符重新排序,确定所有排列组合;将所述所有排列组合,确定为所述核心字符串对应的近似字符串。4.根据权利要求3所述的方法,其特征在于,所述通过预设的域名变形规则,获取所述核心字符串对应的近似字符串,包括:针对每个字符串,根据预先配置的字符与替换字符的对应关系,确定该字符串包含的每个字符分别对应的替换字符;其中,所述字符串包括以下中的一项或多项:所述核心字符串、以及所述核心字符串对应的近似字符串;根据所述每个字符分别对应的替换字符,获取该字符串对应的至少一个替换字符串;其中,所述替换字符串是通过对该字符串中包含的至少一个字符进行替换获取到的;将所述至少一个替换字符串,确定为所述核心字符串对应的近似字符串。5.根据权利要求3所述的方法,其特征在于,所述通过预设的域名变形规则,获取所述核心字符串对应的近似字符串,包括:针对每个字符串,将预先配置的附加字符串添加到该第一字符串中;其中,所述字符串包括以下中的一项或多项:所述核心字符串、以及所述核心字符串对应的近似字符串;将添加后的字符串,确定为所述核心字符串对应的近似字符串。6.根据权利要求1所述的方法,其特征在于,所述方法还包括:对所述核心字符串对应的近似字符串进行去重处理,并删除与所述核心字符串相同的近似字符串。7.一种域名识别方法,其特征在于,所述方法包括:获取待检测域名中包含的核心字符串;其中,所述核心字符串用于唯一标识所述待检测域名;将所述核心字符串与预先保存的近似字符串进行匹配;其中,所述近似字符串是通过预设的域名变形规则生成的;若确定存在匹配的近似字符串,则确定所述待检测域名为违规域名;若确定不存在匹配的近似字符串,确定所述待检测域名为合规域名。
8.一种域名生成装置,其特征在于,所述装置包括:获取模块,用于获取待保护域名中包含的核心字符串;其中,所述核心字符串用于唯一标识所述待保护域名;处理模块,用于通过预设的域名变形规则,获取所述核心字符串对应的近似字符串;其中,所述域名变形规则用于对所述核心字符串中包含的字符进行变换。9.一种域名识别装置,其特征在于,所述装置包括:获取单元,用于获取待检测域名中包含的核心字符串;其中,所述核心字符串用于唯一标识所述待检测域名;匹配单元,用于将所述核心字符串与预先保存的近似字符串进行匹配;其中,所述近似字符串是通过预设的域名变形规则生成的;确定单元,用于若所述匹配单元确定存在匹配的近似字符串,则确定所述待检测域名为违规域名;若所述匹配单元确定不存在匹配的近似字符串,确定所述待检测域名为合规域名。10.一种电子设备,其特征在于,所述电子设备至少包括处理器和存储器,所述处理器用于执行存储器中存储的计算机程序时实现如权利要求1-6中任一所述域名生成方法的步骤,或实现如权利要求7所述域名识别方法的步骤。11.一种计算机可读存储介质,其特征在于,其存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1-6中任一所述域名生成方法的步骤,或实现如权利要求7所述域名识别方法的步骤。

技术总结
本申请公开了一种域名生成和识别方法、装置、设备及介质。由于预先配置有域名变形规则,使得根据该域名变形规则,可以对待保护域名中包含的核心字符串进行变换,从而获取到核心字符串对应的近似字符串,进而根据获取到的近似字符串,确定待保护域名对应的近似域名,从而实现尽可能地获取到所有可能仿冒待保护域名对应的近似域名,无需通过收集的方式获取待保护域名对应的近似域名,极大地减少了获取待保护域名对应的近似域名所需的工作量以及耗费的成本。的成本。的成本。


技术研发人员:穆建光 张龙 赵粤征 叶建伟 黄俊
受保护的技术使用者:北京神州绿盟科技有限公司
技术研发日:2022.03.31
技术公布日:2022/7/5
转载请注明原文地址: https://www.8miu.com/read-1851.html

最新回复(0)