本技术涉及人工智能,尤其涉及一种集团成员识别方法及装置、可读存储介质、计算机程序产品。
背景技术:
1、集团成员是指目标企业或单位的集团内部的自有员工,集团成员数据是集团下政企业务的基础数据,用于集团整建成员运营、集团产品营销等工作,具备较高的业务价值。在实际应用中,集团成员识别可以通过预设的集团成员模型并以集团成员信息为基础,对自有集团成员数据中的非集团成员进行剔除,或对于潜在的集团成员进行补充。但目前的方法仍旧存在一些不足,需要在集团成员识别准确性上进一步提升。
技术实现思路
1、本技术实施例的目的是提供一种集团成员识别方法及装置、可读存储介质、程序产品,用以解决现有集团成员识别准确性低的问题。
2、为了解决上述技术问题,本说明书是这样实现的:
3、第一方面,提供了一种集团成员识别方法,包括:
4、获取第一成员的成员信息、通话信息和集团信息,所述成员信息包括电话号码、常驻基站地址,所述通话信息包括主叫号码、被叫号码、通话次数和通话时长,所述集团信息包括集团标签;
5、基于所述第一成员的成员信息和所述通话信息,获取与各第一成员存在通话关系的第二成员的成员信息;
6、基于获取的成员信息、通信信息和集团信息构建图模型,所述图模型的节点用于表示各第一成员和第二成员,所述图模型的边用于表示节点对应成员之间的通话关系;
7、基于图卷积神经网络算法对各边的特征进行传递,以将所述图模型中目标节点与周围节点对应边的特征加权聚合形成所述目标节点的特征;
8、基于标签传播算法对各第一成员对应节点的集团标签进行传递,以将图模型节点中目标节点的周围节点的标签加权聚合形成所述目标节点的标签;
9、基于所述图模型中各节点的集团标签,输出各集团对应的成员集合。
10、可选地,所述基于获取的成员信息、通信信息和集团信息构建图模型,包括:
11、基于各成员对应的主叫号码和被叫号码之间的通话关系,确定所述图模型的节点和对应的边;
12、基于成员信息确定各节点的成员特征;
13、基于通话信息中的通话次数和通话时长,确定各边的特征;
14、基于各节点的成员特征和边的特征,构建图模型g={v,a,x,y},其中,v表示各节点的集合,a表示包括各边特征的邻接矩阵,x表示各节点的成员特征,y表示各节点的集团标签。
15、可选地,所述基于图卷积神经网络算法对各边的特征进行传递,以将所述图模型中目标节点与周围节点对应边的特征加权聚合形成所述目标节点的特征,包括:
16、以第一目标节点为中心节点,确定所述中心节点与周围节点对应边的特征;
17、将周围节点对应边的特征进行加权平均;
18、将加权平均后的边特征添加到所述第一目标节点的成员特征中;
19、在图卷积神经网络算法训练过程中,基于周围节点对应边的特征的变化,更新所述第一目标节点的成员特征中对应的边特征。
20、可选地,所述基于标签传播算法对各第一成员对应节点的集团标签进行传递,以将图模型节点中目标节点的周围节点的标签加权聚合形成所述目标节点的标签,包括:
21、以第二目标节点为中心节点,确定所述中心节点对应的周围节点的成员特征,所述成员特征包括加权平均后的边特征;
22、分别确定所述第二目标节点的成员特征与周围节点的成员特征的相似度;
23、将相似度大于预设相似度阈值的各目标周围节点的集团标签进行加权平均,并传递到所述第二目标节点上。
24、可选地,所述基于成员信息确定各节点的成员特征,包括:
25、基于目标集团下各第一成员的成员信息中的常驻基站地址,确定所述目标集团所在的区域;
26、基于所述目标集团的各第一成员的常驻基站地址与所述区域边界之间的距离,确定所述目标集团的各第一成员的常驻基站地址对应的成员特征。
27、可选地,所述基于目标集团下各第一成员的成员信息中的常驻基站地址,确定所述目标集团所在的区域,包括:
28、将目标地理区域划分为多个栅格;
29、将位于所述目标地理区域内的目标集团的第一成员的常驻基站地址定位到对应的栅格中;
30、通过预设聚类算法对所述多个栅格进行聚类,以确定所述目标集团的第一成员的常驻基站地址对应的栅格聚类簇;
31、基于所述栅格聚类簇,确定所述目标集团所在的区域。
32、可选地,所述通过预设聚类算法对所述多个栅格进行聚类,以确定所述目标集团的第一成员的常驻基站地址对应的栅格聚类簇之前,还包括:
33、确定目标栅格中所述目标集团的第一成员的数量是否大于所述目标集团对应的成员数量阈值;
34、如果大于所述目标集团对应的成员数量阈值,则将所述目标栅格用于聚类,以确定所述目标集团的第一成员的常驻基站位置对应的栅格聚类簇;
35、如果不大于所述目标集团对应的成员数量阈值,则将所述目标栅格从用于聚类的多个栅格中删除。
36、可选地,所述基于获取的成员信息、通信信息和集团信息构建图模型之前,还包括:
37、基于目标第一成员与对应第一成员之间的通话关系,判断所述目标第一成员是否满足预设规则要求,所述预设规则要求包括以下一项或多项的组合:与目标第一成员通话的各第一成员的数量是否大于第一数量阈值、与所述目标第二成员通话的各第一成员的总通话时长是否大于预设时长阈值、与目标第二成员通话的各第一成员的总通话次数是否大于预设次数阈值、与目标第二成员通话的各第一成员之间是否存在集团交往关系、以及与目标第二成员通话的各第一成员是否订购相同的集团产品;
38、如果所述目标第一成员满足所述预设规则要求,则将所述目标第一成员对应的信息用于所述图模型的构建;
39、如果所述目标第一成员不满足所述预设规则要求,则将所述目标第一成员对应的信息删除。
40、可选地,判断与目标第一成员通话的各第一成员之间是否存在集团交往关系,包括:
41、判断与所述目标第一员通话的各第一成员的数量是否超出第二数量阈值;
42、如果超出所述第二数量阈值,则判断与所述目标第一成员通话的各第一成员之间通话的成员数量是否超出第三数量阈值;
43、如果超出所述第三数量阈值,则确定与所述目标第一成员通话的各第一成员之间存在集团交往关系。
44、第二方面,提供了一种集团成员识别装置,包括处理器和存储器,所述存储器存储可在所述处理器上运行的程序或指令,所述程序或指令被所述处理器执行时实现如第一方面所述的方法的步骤。
45、第三方面,提供了一种可读存储介质,该可读存储介质上存储有程序或指令,所述程序或指令被处理器执行时实现如第一方面所述的方法的步骤。
46、第四方面,提供了一种计算机程序产品,该计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质,所述计算机程序可操作来使计算机执行如第一方面所述的方法的步骤。
47、在本技术实施例中,通过获取第一成员的成员信息、通话信息和集团信息,所述成员信息包括电话号码、常驻基站地址,所述通话信息包括主叫号码、被叫号码、通话次数和通话时长,所述集团信息包括集团标签;基于所述第一成员的成员信息和所述通话信息,获取与各第一成员存在通话关系的第二成员的成员信息;基于获取的成员信息、通信信息和集团信息构建图模型,所述图模型的节点用于表示各第一成员和第二成员,所述图模型的边用于表示节点对应成员之间的通话关系;基于图卷积神经网络算法对各边的特征进行传递,以将所述图模型中目标节点与周围节点对应边的特征加权聚合形成所述目标节点的特征;基于标签传播算法对各第一成员对应节点的集团标签进行传递,以将图模型节点中目标节点的周围节点的标签加权聚合形成所述目标节点的标签;基于所述图模型中各节点的集团标签,输出各集团对应的成员集合,由此使用图模型并结合图神经网络和标签传播算法实现不同集团潜在成员的识别,可显著提升集团成员识别的准确性。
1.一种集团成员识别方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述基于获取的成员信息、通信信息和集团信息构建图模型,包括:
3.根据权利要求2所述的方法,其特征在于,所述基于图卷积神经网络算法对各边的特征进行传递,以将所述图模型中目标节点与周围节点对应边的特征加权聚合形成所述目标节点的特征,包括:
4.根据权利要求3所述的方法,其特征在于,所述基于标签传播算法对各第一成员对应节点的集团标签进行传递,以将图模型节点中目标节点的周围节点的标签加权聚合形成所述目标节点的标签,包括:
5.根据权利要求2所述的方法,其特征在于,所述基于成员信息确定各节点的成员特征,包括:
6.根据权利要求5所述的方法,其特征在于,所述基于目标集团下各第一成员的成员信息中的常驻基站地址,确定所述目标集团所在的区域,包括:
7.根据权利要求6所述的方法,其特征在于,所述通过预设聚类算法对所述多个栅格进行聚类,以确定所述目标集团的第一成员的常驻基站地址对应的栅格聚类簇之前,还包括:
8.根据权利要求1所述的方法,其特征在于,所述基于获取的成员信息、通信信息和集团信息构建图模型之前,还包括:
9.根据权利要求8所述的方法,其特征在于,判断与目标第一成员通话的各第一成员之间是否存在集团交往关系,包括:
10.一种集团成员识别装置,其特征在于,包括处理器和存储器,所述存储器存储可在所述处理器上运行的程序或指令,所述程序或指令被所述处理器执行时实现如权利要求1-9中任一项所述的方法的步骤。
11.一种可读存储介质,其特征在于,所述可读存储介质上存储程序或指令,所述程序或指令被处理器执行时实现如权利要求1-9中任一项所述的方法的步骤。
12.一种计算机程序产品,其特征在于,所述计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质,所述计算机程序可操作来使计算机执行如权利要求1至9中任一项所述的方法的步骤。