用户行为分析方法、装置、介质及电子设备与流程

allin2023-03-26  123



1.本发明属于数据处理领域,特别是涉及一种用户行为分析方法、装置、介质及电子设备。


背景技术:

2.在数据分析中,针对用户行为的分析除了一些可数字化的因素外往往还有很多非数字化的因素。以用户的购买行为为例,促使用户发生购买行为的因素是复杂多样的,既包括能够数字化的影响因素,例如,商品的价格、销量等,又包括无法数字化的影响因素,例如,商品的配送方式、用户评价等。因此,在对用户的购买行为进行复盘分析时既要考虑可数字化的影响因素,又要考虑非数字化的影响因素。然而,现有技术大多基于各种维度对可数字化的影响因素进行分析,而不能对非数字化的影响因素进行客观的分析。


技术实现要素:

3.鉴于以上所述现有技术的缺点,本发明的目的在于提供一种用户行为分析方法、装置、介质及电子设备,用于解决现有技术不能对非数字化的影响因素进行客观分析的问题。
4.为实现上述目的及其他相关目的,本发明的第一方面提供一种用户行为分析方法,包括:根据特定的维度获取多组影响因素及各组影响因素对应的用户行为,其中,各组影响因素中至少包括一种非数字化因素,至少有一组影响因素对应的用户行为包括第一行为;根据所述多组影响因素及各组影响因素对应的用户行为获取用户发生所述第一行为的信息熵;根据所述多组影响因素及各组影响因素对应的用户行为获取在目标影响因素已知的条件下所述用户发生所述第一行为的条件熵;根据所述信息熵和所述条件熵获取所述目标影响因素与所述用户发生所述第一行为的互信息;根据所述互信息获取所述目标影响因素与所述第一行为之间的关联程度。
5.于所述第一方面的一实施例中,所述根据所述互信息获取所述目标影响因素与所述第一行为之间的关联程度包括:判断所述用户发生所述第一行为的时间间隔是否满足预设条件;当所述用户发生所述第一行为的时间间隔满足所述预设条件时,根据所述互信息获取所述目标影响因素与所述第一行为之间的关联程度;当所述用户发生所述第一行为的时间间隔不满足所述预设条件时,根据所述用户及其同类用户的历史行为对所述互信息进行修正,并根据修正后的所述互信息获取所述目标影响因素与所述第一行为之间的关联程度。
6.于所述第一方面的一实施例中,根据所述用户及同类用户的历史行为对所述互信息进行修正的方法包括:获取在包含所述目标影响因素的条件下所述用户最后一次发生所述第一行为的时间作为参考时间;获取所述用户的同类用户发生所述第一行为的平均周期作为参考周期;根据所述参考时间和所述参考周期对所述互信息进行修正。
7.于所述第一方面的一实施例中,根据所述参考时间和所述参考周期对所述互信息
进行修正的一种实现方法包括:采用第一修正公式对所述参考时间、所述参考周期以及所述互信息进行处理以实现对所述互信息的修正,所述第一修正公式为:
[0008][0009]
其中,i(u;x)表示所述互信息,t(x)
last
表示所述参考时间,t
refill(p)
表示参考周期,n是使得0≤t(x)
last-n
×
t
refill(p)
<t
refill(p)
成立的最大自然数。
[0010]
于所述第一方面的一实施例中,根据所述参考时间和所述参考周期对所述互信息进行修正的一种实现方法包括:采用第二修正公式对所述参考时间、所述参考周期以及所述互信息进行处理以实现对所述互信息的修正,所述第二修正公式为:
[0011][0012]
其中,i(u;x)表示所述互信息,t(x)
last
表示所述参考时间,t
refill(p')
表示所述参考周期。
[0013]
于所述第一方面的一实施例中,所述目标影响因素的数量为至少两个,在获取所述目标影响因素与所述第一行为之间的关联程度以后,所述用户行为分析方法还包括:根据各所述目标影响因素与所述第一行为之间的关联程度对各所述目标影响因素进行排序。
[0014]
于所述第一方面的一实施例中,所述根据所述多组影响因素及各组影响因素对应的用户行为获取用户发生所述第一行为的信息熵包括:识别所述影响因素中的缺失数据和异常数据;对所述影响因素中的缺失数据和异常数据进行预处理;对预处理之后的所述影响因素及各组影响因素对应的用户行为进行处理以获取用户发生所述第一行为的信息熵。
[0015]
本发明的第二方面提供一种用户行为分析装置,数据获取模块,用于根据特定的维度获取多组影响因素及各组影响因素对应的用户行为,其中,各组影响因素中至少包括一种非数字化因素,至少有一组影响因素对应的用户行为包括第一行为;信息熵获取模块,与所述数据获取模块相连,用于根据所述多组影响因素及各组影响因素对应的用户行为获取用户发生所述第一行为的信息熵;条件熵获取模块,与所述数据获取模块相连,用于根据所述多组影响因素及各组影响因素对应的用户行为获取在目标影响因素已知的条件下所述用户发生所述第一行为的条件熵;互信息获取模块,与所述信息熵获取模块和所述条件熵获取模块相连,用于根据所述信息熵和所述条件熵获取所述目标影响因素与所述用户发生所述第一行为的互信息;行为分析模块,与所述互信息获取模块相连,用于根据所述互信息获取所述目标影响因素与所述第一行为之间的关联程度。
[0016]
本发明的第三方面提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现本发明第一方面任一项所述的用户行为分析方法。
[0017]
本发明的第四方面提供一种电子设备,所述电子设备包括:存储器,存储有一计算机程序;处理器,与所述存储器通信相连,调用所述计算机程序时执行本发明第一方面任一项所述的用户行为分析。
[0018]
如上所述,本发明一个或多个实施例中所述的用户行为分析方法具有以下有益效果:
[0019]
所述用户行为分析方法能够把对用户购买行为产生影响的非数字化因素产生的信息量用熵的形式进行度量,通过信息熵、条件熵、互信息的方式来对非数字化因素与用户
行为之间的关联程度以数值的形式进行表示,该过程完全不受用户主观因素的影响,因而所述用户行为分析方法能够对用户行为进行客观准确地分析。
[0020]
此外,所述用户行为分析方法还可以根据用户及其同类用户的历史行为对互信息进行修正,通过在所述互信息上叠加一个时间衰减项能够进一步提升分析结果的准确性和客观性。
附图说明
[0021]
图1显示为本发明所述用户行为分析方法于一具体实施例中的流程图。
[0022]
图2显示为本发明所述用户行为分析方法于一具体实施例中对互信息进行修正的流程图。
[0023]
图3显示为本发明所述用户行为分析方法于另一具体实施例中的流程图。
[0024]
图4显示为本发明所述用户行为分析装置于一具体实施例中的结构示意图。
[0025]
图5显示为本发明所述电子设备于一具体实施例中的结构示意图。
[0026]
元件标号说明
[0027]1ꢀꢀꢀꢀꢀꢀꢀꢀꢀ
用户行为分析装置
[0028]
11
ꢀꢀꢀꢀꢀꢀꢀꢀ
数据采集模块
[0029]
12
ꢀꢀꢀꢀꢀꢀꢀꢀ
信息熵获取模块
[0030]
13
ꢀꢀꢀꢀꢀꢀꢀꢀ
条件熵获取模块
[0031]
14
ꢀꢀꢀꢀꢀꢀꢀꢀ
互信息获取模块
[0032]
15
ꢀꢀꢀꢀꢀꢀꢀꢀ
行为分析模块
[0033]
500
ꢀꢀꢀꢀꢀꢀꢀ
电子设备
[0034]
510
ꢀꢀꢀꢀꢀꢀꢀ
存储器
[0035]
520
ꢀꢀꢀꢀꢀꢀꢀ
处理器
[0036]
530
ꢀꢀꢀꢀꢀꢀꢀ
显示器
[0037]
s11~s15
ꢀꢀ
步骤
[0038]
s21~s23
ꢀꢀ
步骤
[0039]
s31~s37
ꢀꢀ
步骤
具体实施方式
[0040]
以下通过特定的具体实例说明本发明的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本发明的其他优点与功效。本发明还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本发明的精神下进行各种修饰或改变。需说明的是,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合。此外,本发明的一些示例性实施例被描述为由方框图表述的装置和由流程图表述的过程或方法。虽然流程图将本发明的操作过程描述成顺序的处理,但是其中的许多操作可以被并行地、并发地或者同时实施。此外,各项操作的顺序可以被重新安排。本发明的过程可在其操作执行完毕时被终止,但也可包括未在所述流程图中示出的额外步骤。本发明的过程可以对应于方法、功能、规程、子例程、子程序等。
[0041]
需要说明的是,以下实施例中所提供的图示仅以示意方式说明本发明的基本构
想,图示中仅显示与本发明中有关的组件而非按照实际实施时的组件数目、形状及尺寸绘制,其实际实施时各组件的型态、数量及比例可为一种随意的改变,且其组件布局型态也可能更为复杂。此外,在本文中,诸如“第一”、“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。
[0042]
在对用户的购买行为进行复盘分析时既要考虑可数字化的影响因素,又要考虑非数字化的影响因素。然而,现有技术大多基于各种维度对可数字化的影响因素进行分析,而不能对非数字化的影响因素进行客观的分析。至少针对上述问题,本发明提供一种用户行为分析方法,所述用户行为分析方法能够把对用户购买行为产生影响的非数字化因素产生的信息量用熵的形式进行度量,通过信息熵、条件熵、互信息的方式来对非数字化因素与用户购买行为之间的关联程度以数值的形式进行表示,该过程完全不受用户主观因素的影响,因而所述用户行为分析方法能够对用户行为进行客观准确地分析。
[0043]
下文中,将通过示例性实施例参照附图描述本发明的具体实施方式。
[0044]
于本发明的一实施例中,所述用户行为分析方法用于对非数字化因素与用户行为之间的关联程度进行定量化的分析。需要说明的是,在一些其他实施例中,所述用户行为分析方法也可用于对数字化因素与用户行为之间的关联程度进行定量化的分析,在另外一些其他实施例中,所述用户行为分析方法还可用于对数字化因素与非数字化因素与用户行为之间的关联程度同时进行定量化的分析。
[0045]
图1显示为本实施例中用户行为分析方法的流程图。如图1所示,本实施例中所述用户行为分析方法包括以下步骤s11至步骤s15。
[0046]
步骤s11,根据特定的维度获取多组影响因素及各组影响因素对应的用户行为,其中,各组影响因素中至少包括一种非数字化因素,并且,至少有一组影响因素对应的用户行为包括第一行为。所述非数字化因素是指不能通过数值进行描述的影响因素,例如,商品好评度、配送方式等。所述特定的维度是指与所述用户行为相关的维度,其可以通过实际需求或者经验设置,也可以通过统计学方法来获取,具体方法本发明不做限制。每一组影响因素均对应于用户的一种行为,且各组影响因素中的每一个影响因素均对应一个维度。需要说明的是,不同组影响因素所对应的用户行为可以相同也可以不同。例如,若所述特定的维度包括:促销活动、商品销量和商品好评度,则一组影响因素可以为:促销活动为满减、商品销量大于1000、商品好评度为优,该组影响因素对应的用户行为为用户的购买行为,另一组影响因素可以为:促销活动为满赠、商品销量大于20000、商品好评度为良,该组影响因素对应的用户行为为用户的不购买行为。
[0047]
步骤s12,根据所述多组影响因素及各组影响因素对应的用户行为获取用户发生所述第一行为的信息熵。其中,所述信息熵用于表示所述用户发生所述第一行为的不确定性,所述信息熵越大说明所述用户发生所述第一行为的不确定性越高,所述信息熵越小说明所述用户发生所述第一行为的不确定性越低。
[0048]
步骤s13,根据所述多组影响因素及各组影响因素对应的用户行为获取在目标影响因素已知的条件下所述用户发生所述第一行为的条件熵。具体地,对于任意的所述目标影响因素x,所述条件熵用于表示在该目标影响因素x已知的条件下所述用户发生所述第一行为的不确定性,其中,所述条件熵越小,说明该目标影响因素x对所述用户发生所述第一
行为的影响越大,反之,所述条件熵越大,则说明该目标影响因素x对所述用户发生所述第一行为的影响越小。
[0049]
步骤s14,根据所述信息熵和所述条件熵获取所述目标影响因素与所述用户发生所述第一行为的互信息。例如,对于所述第一行为以及任意的所述目标影响因素x,该目标影响因素x与所述用户发生所述第一行为的互信息i(u;x)可以表示为:i(u;x)=h(u)-h(u|x),其中,h(u)表示所述用户发生所述第一行为的信息熵,h(u|x)表示在该目标影响因素x已知的条件下所述用户发生所述第一行为的条件熵。
[0050]
步骤s15,根据所述互信息获取所述目标影响因素与所述第一行为之间的关联程度。具体地,若所述目标影响因素与所述第一行为之间的互信息越接近1,则说明所述目标影响因素与所述第一行为之间的关联程度越高,所述目标影响因素对所述用户发生所述第一行为的影响越大。反之,若所述目标影响因素与所述第一行为之间的互信息越接近0,则说明所述目标影响因素与所述第一行为的关联程度越低,所述目标影响因素对所述用户发生所述第一行为的影响越小。
[0051]
应当理解的是,上述标号s11至s15仅用于标识不同的步骤,而非用于限制这些步骤之间的先后顺序,具体应用中可以根据实际需求对来确定上述步骤的执行顺序,例如,可以先执行步骤s12再执行步骤s13,也可以先执行步骤s13再执行步骤s12,亦或者可以同时执行步骤s12和步骤s13,本发明对此不作限制。
[0052]
可选地,所述用户行为还可以包括第二行为。所述用户行为分析方法还能够对所述目标影响因素与所述第一行为和所述第二行为的关联程度同时进行客观的分析。在一些实施例中,所述第一行为可以为对目标商品的购买行为,所述第二行为可以为对目标商品的不购买行为,所述目标商品包括但不限于药品,但本发明并不以此为限。在对用户的购买行为或不购买行为进行分析时,对用户行为产生影响的维度包括但不限于:广告创意、促销活动、商品销量、商品好评度、售后保证、配送方式和/或配送时间。
[0053]
此外,应当理解的是,本实施例中并不限制所述用户行为的种类,除所述第一行为和所述第二行为之外,所述用户行为还可以包括第三行为、第四行为等,无论所述用户行为的种类为多少,本实施例所述用户行为分析方法均能够客观准确地分析所述目标影响因素与各所述用户行为的关联程度。
[0054]
可选地,本实施例中可以预先收集大量用户的数据及行为作为数据集,并通过数据挖掘算法从该数据集中获取与所述第一行为相关的维度。具体来说,数据挖掘是指从大量的数据中通过算法搜索隐藏于其中信息的过程,本实施例可以通过统计、在线分析处理、情报检索、机器学习、专家系统、模式识别等诸多方法来实现所述数据挖掘,从而获取与所述第一行为相关的维度作为所述特定的维度。
[0055]
可选地,所述根据所述多组影响因素及各组影响因素对应的用户行为获取用户发生所述第一行为的信息熵包括:识别所述影响因素中的缺失数据和异常数据;对所述影响因素中的缺失数据和异常数据进行预处理;对预处理之后的所述影响因素及各组影响因素对应的用户行为进行处理以获取用户发生所述第一行为的信息熵。具体来说,由于步骤s11中可以采集用户的大量数据以及行为,在采集过程中难免会出现数据缺失、数据异常等问题,这会对步骤s15中的分析结果产生影响。针对这一问题,本实施例可以通过对步骤s11中采集到的数据进行预处理的方式来消除数据缺失、数据异常等问题对分析结果的影响,从
而提升行为分析的准确度。
[0056]
可选地,本实施例中对于缺失数据的预处理可以包括缺失数据丢弃、缺失数据补全等。其中,缺失数据丢弃是指直接丢弃缺失数据所在组的所有影响因素。缺失数据补全是指通过对已有数据进行分析来获取缺失数据的估计值,并利用估计值来替代所述缺失数据。本实施例中缺失数据补全的方法可以为均值插补、同类均值插补、建模预测、高维映射、多重插补、极大似然估计、压缩感知和矩阵补全等。
[0057]
可选地,本实施例中对于异常数据的预处理可以包括异常数据丢弃、异常数据替换等。其中,异常数据丢弃和异常数据替换与上述缺失数据丢弃和缺失数据替换的实现方法类似,此处不做过多赘述。
[0058]
需要说明的是,以上对缺失数据和异常数据的预处理方式仅为本实施例中实现预处理的两种可选方案,但本发明并不以此为限,具体应用中还可以采用数据标准化、数据归一化、数据编码等方式对步骤s11中获取到的数据进行预处理。
[0059]
可选地,于本实施例中,步骤s12可以采用下式来获取所述信息熵h(u):其中,p(ui)表示用户ui发生所述第一行为的概率,该概率可以通过对所述数据集中用户发生所述第一行为的次数进行统计得到,n表示所述数据集中的用户数量。
[0060]
可选地,于本实施例中,步骤s13可以采用下式来获取所述条件熵h(u|x):其中,x={x1,x2,...,xm},p(ui,xj)表示用户ui发生所述第一行为与所述目标影响因素x的联合概率,该联合概率可以通过对所述数据集中目标影响因素x已知时用户发生所述第一行为的次数进行统计得到,m为所述目标影响因素x中包含的维度的数量。
[0061]
于本发明的一实施例中,所述根据所述互信息获取所述目标影响因素与所述第一行为之间的关联程度的步骤包括:判断所述用户发生所述第一行为的时间间隔是否满足预设条件;当所述用户发生所述第一行为的时间间隔满足所述预设条件时,根据所述互信息获取所述目标影响因素与所述第一行为之间的关联程度;当所述用户发生所述第一行为的时间间隔不满足所述预设条件时,根据所述用户及其同类用户的历史行为对所述互信息进行修正,并根据修正后的所述互信息获取所述目标影响因素与所述第一行为之间的关联程度。具体地,许多商品,例如药品、食品等,用户在发生购买行为一段时间之后通常会对该商品进行再次购买,也即,用户会发生对商品的复购行为。由此可知,用户是否会发生所述第一行为还与用户及其同类用户的历史行为相关,因此,本实施例所述的用户分析方法中还可以包括根据所述用户及其同类用户的历史行为对所述互信息进行修正的步骤,以此来提升获取到的所述互信息的准确性。其中,所述同类用户可以为平台级与该用户同等级的全部会员,例如,若用户为1级用户,则其同类用户为平台的所有1级用户。
[0062]
可选地,图2显示为本实施例中根据所述用户及其同类用户的历史行为对所述互信息进行修正的流程图。如图2所示,本实施例中根据所述用户及其同类用户的历史行为对所述互信息进行修正的过程包括以下步骤s21至步骤s23。
[0063]
步骤s21,获取在包含所述目标影响因素的条件下所述用户最后一次发生所述第
一行为的时间作为参考时间。
[0064]
步骤s22,获取所述用户的同类用户发生所述第一行为的平均周期作为参考周期,所述平均周期可以通过统计等方法得到。
[0065]
步骤s23,根据所述参考时间和所述参考周期对所述互信息进行修正。
[0066]
根据以上描述可知,本实施例中可以根据所述目标商品的属性及其复购周期对所述互信息进行修正,其中所述复购周期是指用户一次购买与再次购买之间的时间间隔。通过此种方式可以更加客观准确地分析非数字化因素与用户的购买行为之间的关联程度。
[0067]
可选地,在一些实施例中,所述预设条件包括第一预设条件。所述第一预设条件例如为用户多次发生所述第一行为的时间间隔相同或近似相同,所述近似相同例如为两个时间间隔的差异小于十天、二十天或三十天等。例如,若所述第一行为是对慢病用药的购买行为,所述慢病用药例如为糖尿病、高血压、心脏病等疾病的治疗药品,由于用户需要周期性地对此类药品进行购买,因此,对此类药品的购买行为近似为周期行为,此时,所述第一行为满足所述第一预设条件,其对应的时间衰减项呈现明显的周期性规律。基于此,本实施例中可以通过为所述互信息叠加一个周期性的时间衰减项来实现对所述互信息的修正。
[0068]
进一步地,对于任一用户,当所述第一行为满足所述第一预设条件时,于本实施例中可以采用以下公式对所述互信息进行修正:
[0069][0070]
其中,i(u;x)表示所述互信息,表示修正后的所述互信息,t(x)
last
表示在包含所述目标影响因素的条件下该用户最后一次发生所述第一行为的时间,也即,所述参考时间,t
refill(p)
表示同类用户发生所述第一行为的平均周期,也即,所述参考周期,t(x)
last
与t
refill(p)
的单位例如为小时、天、周等,n是使得0≤t(x)
last-n
×
t
refill(p)
<t
refill(p)
成立的最大自然数。此外,上述公式中分母所包含的平均周期t
refill(p)
用于实现归一化。通过采用上述方式对所述互信息进行修正,使得修正后的所述互信息能够更加客观准确地反映目标影响因素与用户发生所述第一行为之间的关联程度。
[0071]
可选地,在一些其他实施例中,所述预设条件包括第二预设条件。所述第二预设条件例如为用户多次发生所述第一行为的时间间隔不确定。例如,若所述第一行为是对非慢病用药,例如感冒药,的购买行为,由于用户通常只需一次或少量次地对此类商品进行购买,因此,用户在发生一次购买行为以后,发生下次购买行为的时间是不确定的,因而此类行为对应的时间衰减项并不遵循周期性规律而是遵循指数衰减规律,此类行为可以看作符合所述第二预设条件。基于此,本实施例中可以为所述互信息叠加一个指数型的衰减项来实现对所述互信息的修正。
[0072]
进一步地,对于任一用户,当所述第一行为满足所述第二预设条件时,本实施例中可以采用以下公式对所述互信息进行修正:
[0073][0074]
其中,i(u;x)表示所述互信息,表示修正后的所述互信息,t(x)
last
表示在包含所述目标影响因素的条件下用户最后一次发生所述第一行为至今的时间,也即,所述
参考时间,t
refill(p')
表示同类用户发生所述第一行为的平均周期,也即,所述参考周期,t(x)
last
与t
refill(p
')的单位例如为小时、天、周等。通过采用上述方式对所述互信息进行修正,使得修正后的所述互信息能够更加客观准确地反映目标影响因素与所述第一行为之间的关联程度。
[0075]
根据以上描述可知,当所述第一行为为用户对目标商品的购买行为时,本实施例所述的用户行为分析方法能够把对用户购买行为产生影响的非数字化因素产生的信息量用熵的形式进行度量,通过信息熵、条件熵、互信息的方式来对非数字化因素与用户购买行为之间的关联程度以数值的形式进行表示,该过程完全不受用户主观因素的影响,因而所述用户行为分析方法能够对用户行为进行客观准确地分析。此外,本实施例所述用户行为分析方法还可以根据目标商品的属性及其复购周期对所述互信息进行修正,通过在所述互信息上叠加一个时间衰减项以进一步提升分析结果的准确性和客观性。
[0076]
于本发明的一实施例中,所述目标影响因素的数量为多个。在获取所述目标影响因素与所述第一行为之间的关联程度以后,本实施例中所述用户行为分析方法还可以包括:根据各所述目标影响因素与所述第一行为之间的关联程度对各所述目标影响因素进行排序。
[0077]
可选地,在对各所述影响因素进行排序以后,本实施例中所述用户行为分析方法还可以包括:利用一显示器显示所述影响因素的排序结果,以便用户直观快速地了解到各所述目标影响因素与所述第一行为之间的关联程度。
[0078]
可选地,在对各所述影响因素进行排序以后,本实施例中所述用户行为分析方法还可以包括:根据所述目标影响因素与所述第一行为之间的关联程度对用户进行分组,并在各用户分组中分别对各所述目标影响因素进行排序。需要说明的是,在对用户进行分组时,一个用户可以只属于一个分组,也可以属于多个分组。例如,若所述第一行为属于对目标商品的购买行为,所述目标影响因素包括促销活动、商品销量和商品好评度,则可以根据所述目标影响因素与所述第一行为之间的关联程度将用户划分为购买行为受促销活动影响的用户、购买行为受商品销量影响的因素以及购买行为受商品好评度影响的用户。
[0079]
于本发明的一实施例中,所述第一行为为用户对目标商品的购买行为。本实施例中,所述用户行为分析方法还可以包括:根据各所述目标影响因素与用户购买行为之间的关联程度生成针对某个或某类用户的营销方案。例如,对于某一用户,若步骤s15中得出的分析结果为:促销活动为满减、有售后保障这两个目标影响因素与用户购买行为之间的互信息趋近于1,而24小时配送这一目标影响因素与用户购买行为之间的互信息趋近于0,则针对该用户可以采用满减活动和提高售后保障质量这两个方面进行营销。
[0080]
图3显示为本发明一个较佳实施例中用户行为分析方法的流程图,该较佳实施例中的第一行为为用户对目标商品的购买行为。
[0081]
需要说明的是,该较佳实例仅用于辅助说明所述用户行为分析方法,而非用于限制本发明的保护范围,其中包含的内容并非实现本发明所必须,也即,在一些实施例中可以不包含该较佳实施例的所有步骤。
[0082]
如图3所示,该较佳实施例中所述用户行为分析方法包括以下步骤s31至步骤s37。
[0083]
步骤s31,获取影响用户购买的维度y,所述维度y例如可以包括广告创意、促销活动、商品销量、商品好评度、售后保障、配送方式、配送时间,但本发明并不以此为限。具体应
用中,所述维度y可以根据接收到的用户指令获取,也可以通过统计以及相关性分析来获取,具体实现方式本发明不做限制。
[0084]
步骤s32,将用户发生购买行为和未发生购买行为的数据按照所述维度y、商品属性以及用户进行分组,从而得到用户购买行为与所述维度y的记录,该记录可以通过记录表的形式进行标识,如下表1所示,但本发明并不以此为限。
[0085]
表1用户购买行为记录表
[0086][0087]
步骤s33,计算用户发生购买行为的信息熵。于本实施例中,所述信息熵例如可以采用下式进行计算:其中,p(ui)表示用户ui发生购买行为的概率,n为用户总数。
[0088]
步骤s34,计算在已知维度x的影响下用户发生购买的不确定性,也即,条件熵。于本实施例中,所述条件熵例如可以采用下式进行计算:其中,p(ui,xj)表示用户ui发生购买行为与影响因素x的联合概率,m为影响因素x中包含的维度的数量。所述条件熵的值越低,说明维度x对用户发生购买行为的影响越大。
[0089]
步骤s35,计算用户发生购买行为和已知维度x的互信息。本实施例中,所述互信息例如可以采用下式进行计算:i(u;x)=h(u)-h(u|x)。其中,所述互信息i(u;x)是用来衡量已知维度x和用户发生购买行为的相关性的指标。当已知维度x和用户发生购买行为完全相关时所述互信息i(u;x)为1,当已知维度x和用户发生购买行为完全不相关时所述互信息i(u;x)为0。基于此可知,所述互信息i(u;x)越趋近于1,说明已知维度x对用户发生购买行为的影响越大。
[0090]
步骤s36,对所述互信息i(u;x)进行时间维度的修正。具体地,基于所述互信息i(u;x)可以得到每个用户的每个维度与用户发生购买行为的互信息值,该互信息值能够从统计分析的角度计算维度与用户购买行为的相关性。然而,该相关性不仅与频次等统计信息相关,还与时间相关。因此,步骤s36中可以对所述互信息i(u;x)进行时间维度的修正。例如,步骤s36中可以为所述互信息i(u;x)增加一个叠加时间的衰减项。
[0091]
特别地,在医药领域,所述衰减项与目标商品本身的属性相关。若所述目标商品为慢病用药,则所述衰减项随时间成周期变化,在平均复购周期内,维度x对用户购买行为的影响呈现u型关系。若所述目标商品为非慢病用药,则所述衰减项所时间增加而递减。
[0092]
可选地,当所述目标商品为慢病用药时,根据所述衰减项修正之后的互信息可以通过下式表示:其中,t(x)
last
表示用户最后一次购买所述目标商品至今的时间,t
refill(p)
表示同类用户对所述目标商品的平均复购周期,n是使得0≤t(x)
last-n
×
t
refill(p)
<t
refill(p)
成立的最大自然数。
[0093]
可选地,当所述目标商品为非慢病用药时,根据所述衰减项修正之后的互信息可以通过下式表示:
[0094]
步骤s37,根据修正后的所述互信息获取每个维度与每个用户的购买行为之间的关联程度。基于此,商家在营销过程中可以针对单个用户采用相应的营销方案,实现营销行为的千人千面。
[0095]
基于以上对所述用户行为分析方法的描述,本发明还提供一种用户行为分析装置。具体地,请参阅图4,于本发明的一实施例中,用户行为分析装置1包括数据采集模块11、信息熵获取模块12、条件熵获取模块13、互信息获取模块14以及行为分析模块15。所述用户行为分析装置1用于对非数字化因素与用户行为之间的关联程度进行定量化的分析。需要说明的是,图4所示用户行为分析装置1中的各模块与图1所示用户行为分析方法中的步骤s11至步骤s15一一对应,为节省说明书篇幅,此处不作过多赘述。
[0096]
此外,本实施例中上述各个模块的划分仅仅是一种逻辑功能的划分,实际实现时可以全部或部分集成到一个物理实体上,也可以物理上分开。例如,所述数据采集模块11可以部署在用户终端,而所述信息熵获取模块12、所述条件熵获取模块13、所述互信息获取模块14和所述行为分析模块15可以部署在服务端,所述服务端通过与所述用户终端之间进行通信来获取所述数据采集模块11采集到的数据。又例如,所述数据采集模块11、所述信息熵获取模块12、所述条件熵获取模块13、所述互信息获取模块14和所述行为分析模块15也可以全都部署在服务端。此外,所述用户行为分析装置1中的所有模块可以全部以软件通过处理元件调用的形式实现,也可以全部以硬件的形式实现,还可以部分模块通过处理元件调用软件的形式实现,部分模块通过硬件的形式实现。
[0097]
基于以上对所述用户行为分析方法以及所述用户行为分析装置的描述,本发明的另一方面还提供一种计算机可读存储介质。所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现图1所示的用户行为分析方法。具体地,所述计算机可读存储介质可以为一个或多个用于存储数据的设备,包括只读存储器(rom)、随机存取存储器(ram)、磁性ram、内核存储器、磁盘存储介质、光存储介质、闪存设备和/或其他用于存储信息的机器可读介质。
[0098]
基于以上对所述用户行为分析装置以及所述用户行为分析方法的描述,本发明还提供一种电子设备。图5显示为本发明的一实施例中电子设备500的结构示意图。如图5所示,本实施例中所述电子设备500包括存储器510和处理器520。其中,所述存储器510可以是易失性存储器或非易失性存储器,或可包括易失性和非易失性存储器两者,其上存储有计算机程序。所述处理器520与所述存储器510通信相连,调用所述计算机程序时执行图1所示的用户行为分析方法。其中,所述处理器520可以是通用处理器、数字信号处理器(digital signal processor,dsp)、专用集成电路(application specific integrated circuit,
asic)、现成可编程门阵列(field programmable gate array,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
[0099]
可选地,所述电子设备500还可以包含显示器530。所述显示器530与所述存储器510和所述处理器520通信相连,用于显示所述用户行为分析方法的相关gui交互界面。
[0100]
本发明所述的用户行为分析方法的保护范围不限于本实施例列举的步骤执行顺序,凡是根据本发明的原理所做的现有技术的步骤增减、步骤替换所实现的方案都包括在本发明的保护范围内。
[0101]
本发明还提供一种用户行为分析装置,所述用户行为分析装置可以实现本发明所述的用户行为分析方法,但本发明所述的用户行为分析方法的实现装置包括但不限于本实施例列举的用户行为分析装置的结构,凡是根据本发明的原理所做的现有技术的结构变形和替换,都包括在本发明的保护范围内。
[0102]
综上所述,本发明一个或多个实施例中所述的用户行为分析方法能够把对用户购买行为产生影响的非数字化因素产生的信息量用熵的形式进行度量,通过信息熵、条件熵、互信息的方式来对非数字化因素与用户购买行为之间的关联程度以数值的形式进行表示,该过程完全不受用户主观因素的影响,因而所述用户行为分析方法能够对用户行为进行客观准确地分析。
[0103]
此外,所述用户行为分析方法还可以根据目标商品的属性及其复购周期对所述互信息进行修正,通过在所述互信息上叠加一个时间衰减项能够进一步提升分析结果的准确性和客观性。因此,本发明有效克服了现有技术中的种种缺点而具高度产业利用价值。
[0104]
上述实施例仅例示性说明本发明的原理及其功效,而非用于限制本发明。任何熟悉此技术的人士皆可在不违背本发明的精神及范畴下,对上述实施例进行修饰或改变。因此,举凡所属技术领域中具有通常知识者在未脱离本发明所揭示的精神与技术思想下所完成的一切等效修饰或改变,仍应由本发明的权利要求所涵盖。

技术特征:
1.一种用户行为分析方法,其特征在于,包括:根据特定的维度获取多组影响因素及各组影响因素对应的用户行为,其中,各组影响因素中至少包括一种非数字化因素,至少有一组影响因素对应的用户行为包括第一行为;根据所述多组影响因素及各组影响因素对应的用户行为获取用户发生所述第一行为的信息熵;根据所述多组影响因素及各组影响因素对应的用户行为获取在目标影响因素已知的条件下所述用户发生所述第一行为的条件熵;根据所述信息熵和所述条件熵获取所述目标影响因素与所述用户发生所述第一行为的互信息;根据所述互信息获取所述目标影响因素与所述第一行为之间的关联程度。2.根据权利要求1所述的用户行为分析方法,其特征在于,所述根据所述互信息获取所述目标影响因素与所述第一行为之间的关联程度包括:判断所述用户发生所述第一行为的时间间隔是否满足预设条件;当所述用户发生所述第一行为的时间间隔满足所述预设条件时,根据所述互信息获取所述目标影响因素与所述第一行为之间的关联程度;当所述用户发生所述第一行为的时间间隔不满足所述预设条件时,根据所述用户及其同类用户的历史行为对所述互信息进行修正,并根据修正后的所述互信息获取所述目标影响因素与所述第一行为之间的关联程度。3.根据权利要求2所述的用户行为分析方法,其特征在于,根据所述用户及同类用户的历史行为对所述互信息进行修正的方法包括:获取在包含所述目标影响因素的条件下所述用户最后一次发生所述第一行为的时间作为参考时间;获取所述用户的同类用户发生所述第一行为的平均周期作为参考周期;根据所述参考时间和所述参考周期对所述互信息进行修正。4.根据权利要求3所述的用户行为分析方法,其特征在于,根据所述参考时间和所述参考周期对所述互信息进行修正的一种实现方法包括:采用第一修正公式对所述参考时间、所述参考周期以及所述互信息进行处理以实现对所述互信息的修正,所述第一修正公式为:其中,i(u;x)表示所述互信息,t(x)
last
表示所述参考时间,t
refill(p)
表示所述参考周期,n是使得0≤t(x)
last-n
×
t
refill(p)
<t
refill(p)
成立的最大自然数。5.根据权利要求3所述的用户行为分析方法,其特征在于,根据所述参考时间和所述参考周期对所述互信息进行修正的一种实现方法包括:采用第二修正公式对所述参考时间、所述参考周期以及所述互信息进行处理以实现对所述互信息的修正,所述第二修正公式为:其中,i(u;x)表示所述互信息,t(x)
last
表示所述参考时间,t
refill(p')
表示所述参考周
期。6.根据权利要求1所述的用户行为分析方法,其特征在于,所述目标影响因素的数量为至少两个,在获取所述目标影响因素与所述第一行为之间的关联程度以后,所述用户行为分析方法还包括:根据各所述目标影响因素与所述第一行为之间的关联程度对各所述目标影响因素进行排序。7.根据权利要求1所述的用户行为分析方法,其特征在于,所述根据所述多组影响因素及各组影响因素对应的用户行为获取用户发生所述第一行为的信息熵包括:识别所述影响因素中的缺失数据和异常数据;对所述影响因素中的缺失数据和异常数据进行预处理;对预处理之后的所述影响因素及各组影响因素对应的用户行为进行处理以获取用户发生所述第一行为的信息熵。8.一种用户行为分析装置,其特征在于,所述用户行为分析装置包括:数据获取模块,用于根据特定的维度获取多组影响因素及各组影响因素对应的用户行为,其中,各组影响因素中至少包括一种非数字化因素,至少有一组影响因素对应的用户行为包括第一行为;信息熵获取模块,与所述数据获取模块相连,用于根据所述多组影响因素及各组影响因素对应的用户行为获取用户发生所述第一行为的信息熵;条件熵获取模块,与所述数据获取模块相连,用于根据所述多组影响因素及各组影响因素对应的用户行为获取在目标影响因素已知的条件下所述用户发生所述第一行为的条件熵;互信息获取模块,与所述信息熵获取模块和所述条件熵获取模块相连,用于根据所述信息熵和所述条件熵获取所述目标影响因素与所述用户发生所述第一行为的互信息;行为分析模块,与所述互信息获取模块相连,用于根据所述互信息获取所述目标影响因素与所述第一行为之间的关联程度。9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于:该计算机程序被处理器执行时实现权利要求1-7任一项所述的用户行为分析方法。10.一种电子设备,其特征在于,所述电子设备包括:存储器,存储有一计算机程序;处理器,与所述存储器通信相连,调用所述计算机程序时执行权利要求1-7任一项所述的用户行为分析方法。

技术总结
本发明涉及数据处理领域,提供一种用户行为分析方法、装置、介质及设备。所述用户行为分析方法包括:根据特定的维度获取多组影响因素及各组影响因素对应的用户行为,其中,各组影响因素中至少包括一种非数字化因素,用户行为至少包括第一行为;根据多组影响因素及各组影响因素对应的用户行为获取用户发生第一行为的信息熵;根据多组影响因素及各组影响因素对应的用户行为获取在目标影响因素已知的条件下用户发生第一行为的条件熵;根据信息熵和条件熵获取目标影响因素与用户发生第一行为的互信息;根据互信息获取目标影响因素与第一行为之间的关联程度。所述用户行为分析方法能够对用户行为进行客观准确地分析。对用户行为进行客观准确地分析。对用户行为进行客观准确地分析。


技术研发人员:高永
受保护的技术使用者:康键信息技术(深圳)有限公司
技术研发日:2022.04.21
技术公布日:2022/7/5
转载请注明原文地址: https://www.8miu.com/read-7858.html

最新回复(0)