本发明涉及信息推荐,尤其涉及基于用户行为数据的协同过滤推荐视频。
背景技术:
1、在传统的协同过滤推荐系统中,用户评分是生成推荐列表的主要依据。然而,没有采用用户评分的在应用场景中或用户评分数量比较少的场景中,依据用户评分数据将无法推荐。因此,需要一种新的算法来解决这一问题。
技术实现思路
1、为了解决上述技术问题,本发明的第一个方面提供一种基于用户行为数据的协同过滤推荐视频的方法,其包括:
2、步骤s1:收集用户行为数据,所述用户行为数据包括用户的点击数、浏览时长、评论次数、收藏次数和点赞次数;
3、步骤s2:基于用户行为数据加权计算后得出评分;
4、步骤s3:基于交互数据构建用户-视频交互矩阵,所述交互数据由用户数据、视频数据和评分数据组成;
5、步骤s4:计算用户之间的余弦相似度:
6、
7、i是用户a和用户b共同评价过的视频集合;ra,i表示用户a对视频i的评分;rb,i表示用户b对视频i的评分;和分别表示用户a和用户b对视频集合i评分的平均值;
8、步骤s5:选取余弦相似度高的用户的视频作为推荐结果。
9、进一步地,所述步骤s2包括:
10、步骤s2.1:为每种用户行为数据分配权重;
11、步骤s2.2:将用户行为数据与相应权重相乘,得到加权后的用户评分数据。
12、进一步地,首先,将用户行为数据构建成行为向量:
13、
14、中的各个项是用户的点击数、浏览时长、评论次数、收藏次数和点赞次数;
15、然后,提炼出评分函数:
16、
17、θ为权重系数,用于分配各个用户数据的权重,通过对历史数据分析获得;b是人为设置的偏置量,用来约束权重系数,防止其过于拟合。
18、进一步地,所述权重系数考虑了用户行为数据的重要性和对推荐结果的影响。
19、进一步地,在步骤s3中,所述用户-视频交互矩阵为:
20、
21、进一步地,在步骤s5中,对所用户评分数据进行余弦相似度计算后,得到topn相似用户,采用动态参数选择sum或max模式,选取相似度高topn的用户,进而得到推荐视频:
22、recommenderresult=recommender(topnsimilarityuservideo,model)
23、model∈{max,sum}
24、当model=sum时,推荐视频为
25、当model=max时,推荐视频为max(topnsimilarityuservideo)。
26、本申请的第二个方面提供一种基于用户行为数据的协同过滤推荐视频的系统,其包括:
27、数据获取模块,所述数据获取模块用于收集用户行为数据,所述用户行为数据包括用户的点击数、浏览时长、评论次数、收藏次数和点赞次数;
28、评分计算模块,所述评分计算模块用于基于用户行为数据加权计算后得出评分;
29、用户-视频交互矩阵构建模块,所述用户-视频交互矩阵构建模块用于基于交互数据构建用户-视频交互矩阵,所述交互数据由用户数据、视频数据和评分数据组成;
30、余弦相似度计算模块,所述余弦相似度计算模块用于计算用户之间的余弦相似度:
31、
32、i是用户a和用户b共同评价过的视频集合;ra,i表示用户a对视频i的评分;rb,i表示用户b对视频i的评分;和分别表示用户a和用户b对视频集合i评分的平均值;
33、视频推荐模块,所述视频推荐模块用于选取余弦相似度高的用户的视频作为推荐结果。
34、进一步地,所述评分计算模块用于为每种用户行为数据分配权重,并将用户行为数据与相应权重相乘,得到加权后的用户评分数据。
35、进一步地,所述评分计算模块用于:
36、首先,将用户行为数据构建成行为向量:
37、
38、中的各个项是用户的点击数、浏览时长、评论次数、收藏次数和点赞次数;
39、然后,提炼出评分函数:
40、
41、θ为权重系数,用于分配各个用户数据的权重,通过对历史数据分析获得;b是人为设置的偏置量,用来约束权重系数,防止其过于拟合。
42、进一步地,所述权重系数考虑了用户行为数据的重要性和对推荐结果的影响。
43、进一步地,所述用户-视频交互矩阵为:
44、
45、进一步地,所述视频推荐模块用于:对所用户评分数据进行余弦相似度计算后,得到topn相似用户,采用动态参数选择sum或max模式,选取相似度高topn的用户,进而得到推荐视频:
46、recommenderresult=recommender(topnsimilarityuservideo,model)
47、model∈{max,sum}
48、当model=sum时,推荐视频为
49、当model=max时,推荐视频为max(topnsimilarityuserwideo)。
50、本申请的第三个方面提供一种电子设备,其包括:存储器、处理器以及存储于所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现上述基于用户行为数据的协同过滤推荐视频的方法中的步骤。
51、本申请的第四个方面提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述基于用户行为数据的协同过滤推荐视频的方法中的步骤。
52、采用了上述技术方案后,与现有技术相比,具有以下有益效果:
53、本发明提供了一种基于用户行为数据的协同过滤推荐算法,该算法不依赖于用户评分,而是利用用户点击数、浏览时长、评论次数、收藏次数和点赞次数等行为数据进行加权求和,以生成推荐列表。本发明的协同过滤推荐算法能够不依赖于用户评分,通过用户行为数据进行推荐,从而在没有用户评分数据的情况下也能提供准确的推荐。此外,由于推荐基于用户的实际行为,排除了用户主观因素,使得推荐结果更加通用和泛化。
1.一种基于用户行为数据的协同过滤推荐视频的方法,其特征在于,包括:
2.如权利要求1所述的基于用户行为数据的协同过滤推荐视频的方法,其特征在于,所述步骤s2包括:
3.如权利要求2所述的基于用户行为数据的协同过滤推荐视频的方法,其特征在于,首先,将用户行为数据构建成行为向量:
4.如权利要求3所述的基于用户行为数据的协同过滤推荐视频的方法,其特征在于,所述权重系数考虑了用户行为数据的重要性和对推荐结果的影响。
5.如权利要求1所述的基于用户行为数据的协同过滤推荐视频的方法,其特征在于,在步骤s3中,所述用户-视频交互矩阵为:
6.如权利要求1所述的基于用户行为数据的协同过滤推荐视频的方法,其特征在于,在步骤s5中,对所用户评分数据进行余弦相似度计算后,得到topn相似用户,采用动态参数选择sum或max模式,选取相似度高topn的用户,进而得到推荐视频:
7.一种基于用户行为数据的协同过滤推荐视频的系统,其特征在于,包括:
8.如权利要求7所述的基于用户行为数据的协同过滤推荐视频的系统,其特征在于,所述评分计算模块用于为每种用户行为数据分配权重,并将用户行为数据与相应权重相乘,得到加权后的用户评分数据。
9.如权利要求8所述的基于用户行为数据的协同过滤推荐视频的系统,其特征在于,所述评分计算模块用于:
10.如权利要求9所述的基于用户行为数据的协同过滤推荐视频的系统,其特征在于,所述权重系数考虑了用户行为数据的重要性和对推荐结果的影响。
11.如权利要求7所述的基于用户行为数据的协同过滤推荐视频的系统,其特征在于,所述用户-视频交互矩阵为:
12.如权利要求7所述的基于用户行为数据的协同过滤推荐视频的系统,其特征在于,所述视频推荐模块用于:对所用户评分数据进行余弦相似度计算后,得到topn相似用户,采用动态参数选择sum或max模式,选取相似度高topn的用户,进而得到推荐视频:
13.一种电子设备,其特征在于,包括:存储器、处理器以及存储于所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如权利要求1~6中任一项所述的基于用户行为数据的协同过滤推荐视频的方法中的步骤。
14.一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1~6中任一项所述的基于用户行为数据的协同过滤推荐视频的方法中的步骤。