1.本发明属于跨领域推荐算法领域的一种跨领域数据的推荐方法,尤其是涉及了一种领域自适应的无重叠实体的跨领域数据协同物品推荐算法。
背景技术:2.随着信息技术的迅速发展,电子商务网站(如亚马逊、京东和淘宝等)、在线视频网站(如腾讯视频、爱奇艺和优酷等)、音乐网站(如网易云音乐和qq音乐等)和新闻网站(如今日头条和腾讯新闻)上的内容呈指数级增长,人们对于高效、实时的推荐的需求变得愈发强烈。个性化推荐系统旨在为用户提供个性化的在线产品或服务推荐,以解决日益严重的信息过载问题。协同过滤技术因其简单和高效是目前推荐系统中最流行的方法之一,它根据收集到的其他志同道合用户的偏好等级参数来预测测试用户对新物品的偏好等级参数。矩阵分解因能学习到用户和物品的潜在特征,从而成为协同过滤技术中最流行的方法之一。
3.然而,它也存在数据稀疏性问题。数据稀缺性问题的出现是因为大多数用户倾向于只给他们喜欢的物品中的一小部分进行偏好等级参数。作为一种解决方案,跨领域推荐系统从具有相对丰富数据的辅助领域数据中迁移知识,以辅助目标领域数据中的推荐。现存的大多数跨领域推荐方法都假设领域之间共享重叠的实体,并将其作为跨领域知识迁移的桥梁。然而,这一假设并非普遍成立。例如,电影网站和图书网站的物品完全不同,受商业隐私政策的限制,它们也很难共享重叠的用户。在此场景下,现有的跨领域推荐方法很少考虑领域之间数据分布的不一致性,而是直接将从辅助领域数据学到的簇级知识迁移到目标领域数据,这不能保证知识迁移的一致性。例如码本迁移(codebook transfer,cbt)将从辅助领域数据提取的簇级偏好等级参数模式(即码本)直接迁移到目标领域数据。偏好矩阵生成模型(rating matrix generative model,rmgm)[15]通过将用户/物品组的硬成员约束放松为软成员约束来扩展cbt方法,从而避免全矩阵限制。基于簇级的潜在因子模型(cluster-level based latent factor model,clfm)假设部分簇级的用户-物品偏好等级参数模式可以在多个相关域之间共享。该方法可以将知识从多个不同的辅助领域数据转移到目标领域数据。
[0004]
然而,这些方法都没有考虑领域之间数据分布的不一致性,可能导致不一致的知识迁移。因此,在领域之间不共享重叠的实体的情况下,如何实现一致的知识迁移是跨领域推荐系统面临的问题。
技术实现要素:[0005]
为了解决背景中存在的问题,针对目前跨领域推荐方法没有考虑领域之间的数据分布差异所导致的知识迁移不一致问题,本发明提供一种基于领域自适应的无重叠实体的跨领域协同推荐方法。本发明不需要辅助和目标领域数据的用户之间或物品之间存在交集,而且当目标领域数据极其稀疏的的情况下,仍能获得较高的推荐性能。
[0006]
本发明解决其技术问题采用的技术方案如下:
[0007]
1)通过对目标领域数据的预处理获得目标领域数据的用户-物品偏好矩阵r
t
和用户-物品指示矩阵y
t
,选择与目标领域数据相关联的领域作为辅助领域数据,并通过对辅助领域数据的预处理获得辅助领域数据的用户-物品偏好矩阵ra和用户-物品指示矩阵ya;
[0008]
所述的目标领域数据和辅助领域数据中均包含有用户和物品之间的偏好数据,且对于物品的分类具有有相同的类别。辅助领域数据与目标领域数据的数据是不同领域的或者是不同的场景下获得建立的,辅助领域数据与目标领域数据相关联即是指对于物品的分类具有有相同的类别。
[0009]
例如,目标领域数据为一个用户和书籍物品之间的偏好数据库,辅助领域数据为一个用户和电影物品之间的偏好数据库,书籍物品和电影物品之间具有类似的分类如探险、生活故事等。但不限于此。
[0010]
用户-物品偏好矩阵r
t
中包含了各个用户对各个物品的偏好等级参数,表征了用户对物品的偏好。通常情况下,根据用户对物品的偏好优先级设置不同的,偏好等级参数的值,偏好等级参数的值越大表示用户对物品的偏好更高。
[0011]
用户-物品指示矩阵y
t
中包含了各个用户对各个物品的偏好设置状态参数,表征了用户对物品的偏好是否进行设置。通常情况下,若用户对物品的偏好进行了设置,则偏好设置状态参数为1;若用户对物品的偏好未进行了设置,则偏好设置状态参数为0。
[0012]
2)根据目标领域数据的用户-物品偏好矩阵r
t
和辅助领域数据的用户-物品偏好矩阵ra,处理获得目标领域数据中用户之间和物品之间的相似度矩阵和以及辅助领域数据中用户之间和物品之间的相似度矩阵和
[0013]
3)根据步骤2)获得的各个相似度矩阵构建目标领域数据的用户图和物品图以及辅助领域数据的用户图和物品图
[0014]
4)在目标领域数据和辅助领域数据的用户图和物品图基础上建立带有图正则化项的目标函数,求解目标函数获得目标函数,是整合了领域自适应处理和图正则化项的联合矩阵三分解优化框架,得到最优的领域数据间共享的簇级偏好等级参数模式矩阵s、目标领域数据的用户隐含偏好矩阵u
t
、辅助领域数据的用户隐含偏好矩阵ua的三个参数矩阵;
[0015]
5)根据步骤4)获得的三个参数矩阵的乘积来重构目标领域数据的用户-物品偏好矩阵r
t
获得用户-物品推荐矩阵,实现对目标领域数据的用户-物品偏好矩阵r
t
中的缺失值进行预测,最后利用用户-物品推荐矩阵中的元素值将物品推荐给用户。
[0016]
所述步骤2)具体为:
[0017]
2.1)针对目标领域数据的用户-物品偏好矩阵r
t
,利用其行向量和列向量分别计算用户之间的余弦相似度矩阵和物品之间的余弦相似度矩阵如下式所示:
[0018][0019][0020]
其中,
⊙
表示矩阵按元素相乘,表示矩阵按元素相除,i
m,n
表示每个元素均为1的m×
n矩阵,m
t
表示目标领域数据中的用户数量(即r
t
的行数),n
t
表示目标领域数据中的物品数量(即r
t
的列数),t表示矩阵转置;
[0021]
2.2)针对辅助领域数据的用户-物品偏好矩阵ra,利用其行向量和列向量分别计算用户之间的余弦相似度矩阵和物品之间的余弦相似度矩阵如下式所示:
[0022][0023][0024]
其中,(ra)
ik
表示用户-物品偏好矩阵ra中的第i行、第k列的元素,即辅助领域数据中第i个用户对第k个物品的偏好等级参数。
[0025]
所述步骤3)具体包括:
[0026]
3.1)目标领域数据的用户图按照如下公式获得:
[0027][0028]
上式中,为目标领域数据的用户图的对角矩阵,是由目标领域数据的用户之间的余弦相似度矩阵按行求和作为对角元素获得;
[0029]
对角矩阵的第i个对角元具体按照以下公式处理获得:
[0030][0031]
其中,()
ij
表示矩阵的第i行第j列元素。
[0032]
3.2)目标领域数据的物品图按照如下公式获得:
[0033][0034]
上式中,为目标领域数据的物品图的对角矩阵,是由目标领域数据的物品之间的余弦相似度矩阵按行求和作为对角元素获得;
[0035]
对角矩阵的第i个对角元具体按照以下公式处理获得:
[0036][0037]
其中,()
ij
表示矩阵的第i行第j列元素。
[0038]
3.3)辅助领域数据的用户图按照如下公式获得:
[0039][0040]
上式中,为辅助领域数据的用户图的对角矩阵,是由辅助领域数据的用户之间的余弦相似度矩阵按行求和作为对角元素获得;
[0041]
对角矩阵的第i个对角元素具体按照以下公式处理获得:
[0042][0043]
其中,()
ij
表示矩阵的第i行第j列元素。
[0044]
3.4)辅助领域数据的物品图按照如下公式获得:
[0045][0046]
上式中,为辅助领域数据的物品图的对角矩阵,是由辅助领域数据的物品之间的余弦相似度矩阵按行求和作为对角元素获得。
[0047]
对角矩阵的i个对角元素具体按照以下公式处理获得:
[0048][0049]
其中,()
ij
表示矩阵的第i行第j列元素。
[0050]
所述步骤4)具体为:
[0051]
4.1)目标领域数据和辅助领域数据之间通过共享簇级偏好等级参数模式来对目标偏好矩阵r
t
和辅助偏好矩阵ra进行联合矩阵三分解,再增加建立针对目标领域数据和辅助领域数据的用户图和物品图的图正则化项,整合到目标函数中,进而建立以下目标函数,以避免负迁移,表示如下:
[0052][0053]
上式中,j表示目标函数,s为领域数据间共享的簇级偏好等级参数模式矩阵,u
t
表示目标领域数据的用户隐含偏好矩阵,ua表示辅助领域数据的用户隐含偏好矩阵,v
t
表示目标领域数据的物品隐含特征矩阵,va表示辅助领域数据的物品隐含特征矩阵;αu和αv分别为对齐领域分布的用户正则化参数和物品正则化参数,y
t
和ya分别表示目标领域数据、辅助领域数据的用户-物品偏好矩阵r
t
和ra中的偏好等级参数是否被观测到的指示矩阵,
⊙
表示矩阵按元素相乘,λ为权衡参数,用于表示辅助数据的置信度,||
·
||f是frobenius范数,βu和βv分别为用户图正则化参数和物品图正则化参数,mmd(ua,u
t
)为用户在辅助和目标领域数据之间的特征分布差异,mmd(va,v
t
)为物品在辅助和目标领域数据之间的特征分布差异;表示目标领域数据用户图的图正则化项,表示目标领域数据物品图的图正则化项,表示辅助领域数据用户图的图正则化项,表示辅助领域数据物品图的图正则化项;
[0054]
4.2)采用交替最小化算法对目标函数进行优化求解,获得最优的领域数据间共享的簇级偏好等级参数模式矩阵s、目标领域数据的用户隐含偏好矩阵u
t
、辅助领域数据的用户隐含偏好矩阵ua、目标领域数据的物品隐含特征矩阵v
t
和辅助领域数据的物品隐含特征矩阵va。
[0055]
本发明中,u代表用户,v代表物品。t表示目标领域数据,a表示辅助领域数据。
[0056]
本发明建立的上述目标函数能够能够减小领域间的分布差异,确保数据迁移的一致性,避免负迁移。
[0057]
所述的用户在辅助领域数据和目标领域数据之间的特征分布差异mmd(ua,u
t
)按照以下公式计算获得:
[0058][0059][0060][0061]
上式中,m
t
和ma分别表示目标领域数据和辅助领域数据中的用户数量,u
a,t
表示目标领域数据的用户隐含偏好矩阵u
t
和辅助领域数据的用户隐含偏好矩阵ua的垂直连接,hu是用户最大均值差异矩阵mmd(maximum mean discrepancy),i
m,n
表示每个元素均为1的m
×
n矩阵,()i表示矩阵的第i行,||
·
||2表示向量二范数的平方;
[0062]
所述的物品在辅助领域数据和目标领域数据之间的特征分布差异mmd(va,v
t
)按照以下公式计算获得:
[0063][0064][0065][0066]
上式中,na和n
t
分别表示目标领域数据和辅助领域数据中的物品数量,v
a,t
表示目标领域数据的物品隐含特征矩阵v
t
和辅助领域数据的物品隐含特征矩阵va的垂直连接,hv是物品mmd矩阵。
[0067]
所述的特征分布差异mmd(ua,u
t
)和特征分布差异mmd(va,v
t
)还可以利用分块矩阵的乘法分别计算表示为:
[0068][0069][0070]
其中,tr(
·
)表示矩阵的迹。
[0071]
所述的目标领域数据的用户图的图正则化项和物品图的图正则化项辅助领域数据的用户图的图正则化项和物品图的图正则化项构建如
下:
[0072][0073][0074][0075][0076]
上式中,tr(
·
)表示矩阵的迹;u
t
为目标领域数据中的用户隐含偏好矩阵,v
t
为目标领域数据中的物品隐含特征矩阵,ua为辅助领域数据中的用户隐含偏好矩阵,va为辅助领域数据中的物品隐含特征矩阵。
[0077]
所述4.2)中,具体是将mmd(ua,u
t
)、mmd(va,v
t
)、和的具体表达式带入目标函数,得最终的优化目标函数如下:
[0078][0079]
上式中,η为用于控制过拟合的正则化参数。
[0080]
然后采用交替最小化算法对最优目标函数进行优化,在领域数据间共享的簇级偏好等级参数模式矩阵s、目标领域数据的用户隐含偏好矩阵u
t
、辅助领域数据的用户隐含偏好矩阵ua、目标领域数据的物品隐含特征矩阵v
t
和辅助领域数据的物品隐含特征矩阵va的五个参数矩阵中,每次迭代时候优化更新其中一个参数矩阵的所有元素值而固定剩余参数矩阵的所有元素值,不断重复循环直到收敛。
[0081]
五个参数矩阵的迭代的优化更新公式如下:
[0082][0083][0084]
[0085][0086][0087][0088][0089][0090][0091][0092][0093][0094][0095]
上式中,表示按元素相除,表示目标领域用户图,表示目标领域用户图的绝对值与目标领域用户图之和的一半,表示目标领域用户图的绝对值与目标领域用户图之差的一半;表示辅助领域用户图的绝对值与辅助领域用户图之和的一半,表示辅助领域用户图的绝对值与辅助领域用户图之差的一半;表示目标领域物品图的绝对值与目标领域物品图之和的一半,表示目标领域物品图的绝对值与目标领域物品图之差的一半;表示辅助领域物品图的绝对值与辅助领域物品图之和的一半,表示辅助领域物品图的绝对值与辅助领域物品图之差的一半;
[0096]
目标领域用户图可能带有任何的符号,将目标领域用户图分解为表示辅助领域用户图,辅助领域用户图可能带有任何的符号,将辅助领域用户图分解为目标领域物品图可能带有任何的符号,将目标领域物品图分解为辅助领域物品图可能带有任何的符号,将辅助领域物品图分解为
[0097]
不断循环依次更新参数矩阵s,u
t
,ua,v
t
和va,直到收敛或达到预设的最大迭代次数,此时所得的s,u
t
,ua,v
t
和va即为最优解。
[0098]
所述步骤5)具体为:
[0099]
根据步骤4)获得的领域数据间共享的簇级偏好等级参数模式矩阵s、目标领域数
据的用户隐含偏好矩阵u
t
、目标领域数据的物品隐含特征矩阵va,按照以下公式重构获得目标领域数据的用户-物品推荐矩阵
[0100][0101]
式中,表示对用户-物品偏好矩阵r
t
的重构矩阵;
[0102]
最后根据用户-物品推荐矩阵中的预测偏好等级参数结果,即其中的元素值,将元素值位于最高的前若干个物品推荐给用户。
[0103]
在本发明方法处理前,目标领域数据是不完整的,缺失了很多用户和物品之间的偏好参数,通过本发明方法利用辅助领域数据对目标领域数据处理后,使得目标领域数据重构成完整的数据且修正预测完善了数据的准确性,进而实现更准确有效的推荐。
[0104]
本发明针对辅助和目标领域数据之间的用户和物品没有交集的跨领域推荐场景中,现存的跨领域推荐方法没有考虑领域间的数据分布差异从而导致的知识迁移不一致问题,通过在联合矩阵分解框架中并入最大分布差异正则项来对齐领域之间的数据分布,并且通过进一步并入用户图和物品图的图正则化项来避免负迁移,最终获得一个统一的优化目标函数,通过对该目标函数的求解,来重构目标领域数据偏好矩阵,进而实现推荐。
[0105]
本发明主要针对电子商务网站、在线视频网站、音乐网站等在线平台上的不同领域数据进行物品推荐。
[0106]
本发明的有益效果是:
[0107]
本发明使用领域自适应技术来对齐领域间的数据分布,确保了知识迁移的一致性,能够提高目标领域数据中的推荐性能。
[0108]
本发明尤其适用于对新上线的推荐系统,因其数据稀疏性问题尤其严重,而且往往与辅助领域数据的用户或物品之间不存在交集,急需从一个成熟的推荐系统中获益。
[0109]
本发明的优势在于不需要辅助和目标领域数据的用户或物品之间存在交集,而且当目标领域数据极其稀疏时(密集度低于0.1%),仍然能够获得较好的推荐性能。在跨领域推荐方面,相比其它方法,本发明可以获得更高的预测性能。
附图说明
[0110]
图1是本发明实施步骤流程图,通过对目标偏好矩阵r
t
和辅助偏好矩阵ra进行联合矩阵三分解,同时约束领域间共享簇级偏好等级参数模式s和利用最大均值差异正则项mmd来对齐领域之间的数据分布,使得一致的知识能够被迁移到目标领域数据。此外,用户图和物品图的图正则化被用于保持领域内的几何结构,避免负迁移。通过对该优化问题进行求解,获得目标领域数据用户偏好矩阵u
t
,目标领域数据物品隐含特征矩阵v
t
,辅助领域数据用户隐含偏好矩阵ua,辅助领域数据物品隐含特征矩阵va和领域之间共享的簇级偏好等级参数模式s。然后,利用来对目标领域数据偏好矩阵r
t
进行重构并对r
t
中的缺失偏好等级参数进行预测。最后将预测偏好等级参数高且用户未购过的物品推荐给用户。
[0111]
图2是goodreads为辅助数据,netflix电影为目标数据,本发明方法ccr-da与其它方法的mae(平均绝对误差)对比结果图;
[0112]
图3是goodreads为辅助数据,netflix电影为目标数据,本发明方法ccr-da与其它
方法的rmse对比结果图;
[0113]
图4是amazonbook图书为辅助数据,doubanbook图书为目标数据,本发明方法ccr-da与其它方法的mae对比结果图;
[0114]
图5是amazonbook图书为辅助数据,doubanbook图书为目标数据,本发明方法ccr-da与其它方法的rmse对比结果图;
[0115]
图6是本发明方法ccr-da框架中参数α的变化对rmse的影响图;
[0116]
图7是本发明方法ccr-da框架中参数β变化对rmse的影响图;
[0117]
图8是本发明方法ccr-da框架中参数η变化对rmse的影响图。
具体实施方式
[0118]
下面结合附图1及具体实例对本发明作进一步详细说明。
[0119]
如图1所示,按照本发明发明内容的完整方法实施的实施例及其过程如下:
[0120]
1)根据目标领域数据选择与之相关的辅助领域数据,例如目标领域数据是电影领域,则可选择图书领域或音乐领域作为辅助领域数据。
[0121]
2)通过对目标领域数据和辅助领域数据中的用户行为数据进行预处理,获得目标领域数据偏好矩阵r
t
和辅助领域数据偏好矩阵ra。目标偏好矩阵r
t
按照一定的比例被随机分裂成训练集和测试集。
[0122]
3)计算目标领域数据用户之间相似度矩阵和物品之间相似度矩阵以及辅助领域数据用户之间相似度矩阵和物品之间相似度矩阵然后构建目标领域数据用户图和物品图以及辅助领域数据用户图和物品图
[0123]
4)确定r
t
中的用户数量m
t
和物品数量n
t
,以及ra中的用户数量ma和物品数量na。随机初始化目标领域数据用户隐含偏好矩阵u
t
和物品隐含特征矩阵v
t
,领域之间共享的簇级偏好等级参数模式矩阵s,以及辅助领域数据用户隐含偏好矩阵ua和物品隐含特征矩阵va。
[0124]
5)求解优化问题目标,依次更新变量s,u
t
,ua,v
t
和va,直到收敛或达到预设的最大迭代次数,此时所得的s,u
t
,ua,v
t
和va即为优化问题的最优解。
[0125]
6)利用来对目标领域数据偏好矩阵r
t
进行重构并对r
t
中的缺失偏好等级参数进行预测,并将预测偏好等级参数高且用户未购过的物品推荐给用户。
[0126]
7)图2和图3是以netflix电影偏好等级参数数据集中取4000个用户对2000个电影的偏好等级参数为目标领域数据,而以goodreads图书偏好等级参数数据集中取4000个用户对2000个图书的偏好等级参数为辅助领域数据,在目标领域数据偏好矩阵密集度不同的情况下,本发明方法ccr-da与其它方法的mae(平均绝对误差)对比结果和rmse(均根方误差)对比结果。图4和图5是以amazonbook图书偏好等级参数数据集中取4000个用户对2000个电影的偏好等级参数为目标领域数据,而以doubanbook图书偏好等级参数数据集中取4000个用户对2000个图书的偏好等级参数为辅助领域数据,在目标领域数据偏好矩阵密集度不同的情况下,本发明方法ccr-da与其它方法的mae(平均绝对误差)对比结果和rmse(均根方误差)对比结果。图6~图8展示了本发明方法ccr-da中的参数αu=αv=α,βu=βv=β和η的变化对rmse的影响。
[0127]
由此实施可以看到本发明方法ccr-da在两个跨领域推荐任务的所有密集度上的
mae和rmse结果都是最好的。尤其当密集度越低时,本发明方法相对其它方法的性能提升越明显。这证明了将mmd正则项整合到联合矩阵三分解中,能够有效降低领域间的数据分布,实现一致的知识迁移,从而大大提高推荐性能,特别是在目标域非常稀疏的情况下。
技术特征:1.一种领域自适应的无重叠实体的跨领域数据协同物品推荐算法,其特征在于:所述方法步骤具体如下:1)通过对目标领域数据的预处理获得目标领域数据的用户-物品偏好矩阵r
t
和用户-物品指示矩阵y
t
,选择与目标领域数据相关联的领域作为辅助领域数据,并通过对辅助领域数据的预处理获得辅助领域数据的用户-物品偏好矩阵r
a
和用户-物品指示矩阵y
a
;2)根据目标领域数据的用户-物品偏好矩阵r
t
和辅助领域数据的用户-物品偏好矩阵r
a
,处理获得目标领域数据中用户之间和物品之间的相似度矩阵和以及辅助领域数据中用户之间和物品之间的相似度矩阵和3)根据步骤2)获得的各个相似度矩阵构建目标领域数据的用户图和物品图以及辅助领域数据的用户图和物品图4)在目标领域数据和辅助领域数据的用户图和物品图基础上建立带有图正则化项的目标函数,求解目标函数获得最优的三个参数矩阵;5)根据步骤4)获得的三个参数矩阵的乘积来重构目标领域数据的用户-物品偏好矩阵r
t
获得用户-物品推荐矩阵,实现对目标领域数据的用户-物品偏好矩阵r
t
中的缺失值进行预测,最后利用用户-物品推荐矩阵将物品推荐给用户。2.根据权利要求1所述的一种领域自适应的无重叠实体的跨领域数据协同物品推荐算法,其特征在于:所述步骤2)具体为:2.1)针对目标领域数据的用户-物品偏好矩阵r
t
,分别计算用户之间的余弦相似度矩阵和物品之间的余弦相似度矩阵w
tv
,如下式所示:,如下式所示:其中,
⊙
表示矩阵按元素相乘,表示矩阵按元素相除,i
m,n
表示每个元素均为1的m
×
n矩阵,m
t
表示目标领域数据中的用户数量,n
t
表示目标领域数据中的物品数量,t表示矩阵转置;2.2)针对辅助领域数据的用户-物品偏好矩阵r
a
,分别计算用户之间的余弦相似度矩阵和物品之间的余弦相似度矩阵如下式所示:如下式所示:其中,(r
a
)
ik
表示用户-物品偏好矩阵r
a
中的第i行、第k列的元素。3.根据权利要求1所述的一种领域自适应的无重叠实体的跨领域数据协同物品推荐算
法,其特征在于:所述步骤3)具体包括:3.1)目标领域数据的用户图按照如下公式获得:上式中,为目标领域数据的用户图的对角矩阵,是由目标领域数据的用户之间的余弦相似度矩阵按行求和作为对角元素获得;3.2)目标领域数据的物品图按照如下公式获得:上式中,为目标领域数据的物品图的对角矩阵,是由目标领域数据的物品之间的余弦相似度矩阵w
tv
按行求和作为对角元素获得;3.3)辅助领域数据的用户图按照如下公式获得:上式中,为辅助领域数据的用户图的对角矩阵,是由辅助领域数据的用户之间的余弦相似度矩阵按行求和作为对角元素获得;3.4)辅助领域数据的物品图按照如下公式获得:上式中,为辅助领域数据的物品图的对角矩阵,是由辅助领域数据的物品之间的余弦相似度矩阵w
tv
按行求和作为对角元素获得。4.根据权利要求1所述的一种领域自适应的无重叠实体的跨领域数据协同物品推荐算法,其特征在于:所述步骤4)具体为:4.1)目标领域数据和辅助领域数据之间对目标偏好矩阵r
t
和辅助偏好矩阵r
a
进行联合矩阵三分解,再增加建立针对目标领域数据和辅助领域数据的用户图和物品图的图正则化项,进而建立以下目标函数,表示如下:上式中,j表示目标函数,s为领域数据间共享的簇级偏好等级参数模式矩阵,u
t
表示目标领域数据的用户隐含偏好矩阵,u
a
表示辅助领域数据的用户隐含偏好矩阵,v
t
表示目标领域数据的物品隐含特征矩阵,v
a
表示辅助领域数据的物品隐含特征矩阵;α
u
和αv分别为对齐领域分布的用户正则化参数和物品正则化参数,y
t
和y
a
分别表示目标领域数据、辅助领域数据的用户-物品偏好矩阵r
t
和r
a
中的偏好等级参数是否被观测到的指示矩阵,
⊙
表示矩阵按元素相乘,λ为权衡参数,用于表示辅助数据的置信度,||
·
||
f
是frobenius范数,β
u
和βv分别为用户图正则化参数和物品图正则化参数,mmd(u
a
,u
t
)为用户在辅助和目标领域数据之间的特征分布差异,mmd(v
a
,v
t
)为物品在辅助和目标领域数据之间的特征分布差异;表示目标领域数据用户图的图正则化项,表示目标领域数据物品图的图正则化项,
表示辅助领域数据用户图的图正则化项,表示辅助领域数据物品图的图正则化项;4.2)采用交替最小化算法对目标函数进行优化求解,获得最优的领域数据间共享的簇级偏好等级参数模式矩阵s、目标领域数据的用户隐含偏好矩阵u
t
、辅助领域数据的用户隐含偏好矩阵u
a
、目标领域数据的物品隐含特征矩阵v
t
和辅助领域数据的物品隐含特征矩阵v
a
。5.根据权利要求4所述的一种领域自适应的无重叠实体的跨领域数据协同物品推荐算法,其特征在于:所述的用户在辅助领域数据和目标领域数据之间的特征分布差异mmd(u
a
,u
t
)按照以下公式计算获得:公式计算获得:公式计算获得:上式中,m
t
和m
a
分别表示目标领域数据和辅助领域数据中的用户数量,u
a,t
表示目标领域数据的用户隐含偏好矩阵u
t
和辅助领域数据的用户隐含偏好矩阵u
a
的垂直连接,h
u
是用户最大均值差异矩阵,i
m,n
表示每个元素均为1的m
×
n矩阵,()i表示矩阵的第i行,||
·
||2表示向量二范数的平方;所述的物品在辅助领域数据和目标领域数据之间的特征分布差异mmd(v
a
,v
t
)按照以下公式计算获得:公式计算获得:公式计算获得:上式中,n
a
和n
t
分别表示目标领域数据和辅助领域数据中的物品数量,v
a,t
表示目标领域数据的物品隐含特征矩阵v
t
和辅助领域数据的物品隐含特征矩阵v
a
的垂直连接,h
v
是物品mmd矩阵。6.根据权利要求4所述的一种领域自适应的无重叠实体的跨领域数据协同物品推荐算法,其特征在于:
所述的目标领域数据的用户图的图正则化项和物品图的图正则化项辅助领域数据的用户图的图正则化项和物品图的图正则化项构建如下:构建如下:构建如下:构建如下:上式中,tr(
·
)表示矩阵的迹;u
t
为目标领域数据中的用户隐含偏好矩阵,v
t
为目标领域数据中的物品隐含特征矩阵,u
a
为辅助领域数据中的用户隐含偏好矩阵,v
a
为辅助领域数据中的物品隐含特征矩阵。7.根据权利要求1所述的一种领域自适应的无重叠实体的跨领域数据协同物品推荐算法,其特征在于:所述步骤5)具体为:根据步骤4)获得的领域数据间共享的簇级偏好等级参数模式矩阵s、目标领域数据的用户隐含偏好矩阵u
t
、目标领域数据的物品隐含特征矩阵v
a
,按照以下公式重构获得目标领域数据的用户-物品推荐矩阵物品推荐矩阵式中,表示对用户-物品偏好矩阵r
t
的重构矩阵;最后根据用户-物品推荐矩阵中的预测偏好等级参数结果,即其中的元素值,将元素值位于最高的前若干个物品推荐给用户。
技术总结本发明公开了一种领域自适应的无重叠实体的跨领域数据协同物品推荐算法。对目标和辅助领域数据预处理获得各自的用户-物品偏好矩阵和用户-物品指示矩阵;再处理获得用户之间和物品之间的相似度矩阵;根据相似度矩阵构建用户图和物品图;建立带有图正则化项的目标函数,求解目标函数获得得到最优的三个参数矩阵;用三个参数矩阵乘积来重构获得用户-物品推荐矩阵,用用户-物品推荐矩阵将物品推荐给用户。本发明使用领域自适应技术来对齐领域间的数据分布,确保了知识迁移的一致性,能够提高目标领域数据中的推荐性能。高目标领域数据中的推荐性能。高目标领域数据中的推荐性能。
技术研发人员:孔祥维 张洪为
受保护的技术使用者:浙江大学
技术研发日:2022.03.30
技术公布日:2022/7/5