本技术涉及弹幕处理,具体涉及一种直播弹幕问题的处理方法、系统、设备及存储介质。
背景技术:
1、在当前的直播行业中,主播与观众之间的互动主要通过弹幕形式进行,这种实时互动极大地增强了观众的参与感和直播的趣味性。然而,面对大量且多样化的弹幕提问,主播往往难以一一即时回复,尤其是当大量观众就同一问题(如商品价格)进行询问时,重复回答不仅耗时且效率低下。
2、为了解决上述问题,现有技术尝试通过弹幕聚类的方法对观众提问进行分类处理。具体而言,如已公开的中国专利cn118093778a通过文本嵌入表示对弹幕内容进行聚类,旨在将相似或重复的提问归为一类,进而通过faq(常见问题解答)检索的方式给出统一回答。这种方法在一定程度上减轻了主播的回复负担,提高了回答效率。然而,现有技术在实际应用中仍存在显著不足:聚类后依赖faq检索的方式回答问题,虽然能覆盖部分常见问题,但对于新兴问题的提问,其回复的准确性和针对性有限。
3、鉴于此,本技术提出了一种直播弹幕问题的处理方法、系统、设备及存储介质,能够提高直播互动的效率和专业性。
技术实现思路
1、为了解决现有技术弹幕问题回复的准确性和针对性有限等问题,本技术提供一种直播弹幕问题的处理方法、系统、设备及存储介质,以解决上述技术缺陷问题。
2、根据本技术的第一方面提出了一种直播弹幕问题的处理方法,该方法包括以下步骤:
3、s1、采集直播过程中的弹幕问题信息,弹幕问题信息包括:观众会话id、弹幕发送时间以及弹幕内容;
4、s2、利用基于bert的意图分类模型对弹幕内容进行意图分类,获得弹幕意图分类结果;
5、s3、根据弹幕发布速度动态调整分析时间间隔,在每个时间间隔内执行以下操作:
6、基于观众会话id判断是否有新观众进入直播间,若检测到新观众且提问意图在之前未被回答过,则生成回复;
7、判断多个弹幕意图分类结果是否相同,若意图虽相同但无新观众,且相同意图的弹幕发送时间的间隔未超过预设阈值,则不生成回复;
8、若存在新意图或相同意图的弹幕发送时间的间隔超过预设阈值,则生成对应意图的回复。
9、优选的,在步骤s2中,利用基于bert的意图分类模型对弹幕内容进行意图分类,具体包括以下子步骤:
10、s21、定义直播弹幕内容的意图类别,并收集相应的弹幕数据;
11、s22、对收集到的弹幕数据进行初步意图预标注后,进行错误标签的修正,最终获得待用弹幕数据集;
12、s23、利用开源bert模型作为意图分类的基础模型,基于待用弹幕数据集进行训练;
13、s24、将弹幕内容输入至训练好的意图分类模型中,输出对应的弹幕意图分类结果。
14、进一步优选的,在步骤s23中,训练过程中采用focal loss作为损失函数,以及在开源bert模型基础上引入fgm对抗训练技术。
15、优选的,本技术提供的直播弹幕问题的处理方法,还包括以下步骤:
16、s4、根据弹幕意图分类结果,结合预设的回复规则,自动生成回复内容,并将回复内容发送至直播界面。
17、优选的,在步骤s1中,采集直播过程中的弹幕问题信息,还包括对采集的弹幕问题信息进行时间戳标记,获得弹幕发送时间。
18、优选的,本技术提供的直播弹幕问题的处理方法,还包括以下步骤:
19、始化定时器,设定定时器的初始值为t秒,t为大于0的自然数,通过定时器捕获并缓存直播过程中的弹幕问题信息;
20、每经过时间t秒,执行一次弹幕问题信息的分析操作。
21、优选的,在步骤s3中,基于所述观众会话id判断是否有新观众进入直播间以及提问意图在之前是否被回答过,具体通过以下方式进行检测:
22、建立一个哈希表,用于存储弹幕意图分类结果及其相关信息,相关信息包括观众会话id和是否已回答;
23、为每个新识别的弹幕意图分类结果生成一个唯一标识符;
24、存储新识别的弹幕意图分类结果时,检测在预设的时间间隔内新识别的弹幕意图分类结果是否已存在于哈希表中,若存在且已回答,则跳过;否则,将新识别的弹幕意图分类结果添加到哈希表中并标记为未回答。
25、第二方面,本技术提供了一种直播弹幕问题的处理系统,该系统包括:
26、弹幕采集模块,配置于采集直播过程中的弹幕问题信息,弹幕问题信息包括:观众会话id、弹幕发送时间以及弹幕内容;
27、意图分类模块,配置于利用基于bert的意图分类模型对弹幕内容进行意图分类,获得弹幕意图分类结果;
28、回复处理模块,配置于根据弹幕发布速度动态调整分析时间间隔,在每个时间间隔内执行以下操作:
29、基于观众会话id判断是否有新观众进入直播间,若检测到新观众且提问意图在之前未被回答过,则生成回复;
30、判断多个弹幕意图分类结果是否相同,若意图虽相同但无新观众,且相同意图的弹幕发送时间的间隔未超过预设阈值,则不生成回复;
31、若存在新意图或相同意图的弹幕发送时间的间隔超过预设阈值,则生成对应意图的回复。
32、第三方面,本技术提供了一种终端设备,包括处理器、存储器以及存储在存储器内的计算机程序,计算机程序被处理器执行以实现如上述任意一项的直播弹幕问题的处理方法。
33、第四方面,本技术提供了一种计算机可读存储介质,介质中存储有计算机程序,在计算机程序被处理器执行时,实施如上述任意一项的直播弹幕问题的处理方法。
34、与现有技术相比,本发明的有益成果在于:
35、(1)提升观众体验与互动效率:通过动态调整分析时间间隔并基于观众会话id识别新观众及其提问意图,本发明能够确保新观众的提问得到及时响应,同时避免对重复提问的过度响应,从而提升了观众的参与感和满意度,增强了直播的互动性和效率。
36、(2)精准意图分类与高效回复:
37、现有聚类算法的类别划分往往依赖于预设的阈值或参数,这些参数的设定往往难以精准把握,导致聚类结果不够理想,可能出现类别划分过细或过粗的情况。聚类后依赖faq检索的方式回答问题,虽然能覆盖部分常见问题,但对于新兴问题的提问,其回复的准确性和针对性有限。
38、本发明利用基于bert的意图分类模型,本发明能够准确识别弹幕内容的意图,并根据意图分类结果智能生成回复。这种精确的分类和针对性的回复机制,不仅提高了回复的准确性和有效性,还减少了人工干预的需要,降低了运营成本。
39、(3)优化资源分配与避免冗余:通过判断多个弹幕意图分类结果是否相同以及弹幕发送时间的间隔是否超过预设阈值,本发明能够有效避免对相同意图的重复回复,从而节省了系统资源,并减少了观众界面的信息冗余,提升了用户体验。
40、(4)强化模型性能与鲁棒性:在模型训练过程中采用focal loss作为损失函数,并在开源bert模型基础上引入fgm对抗训练技术,本发明能够增强模型的泛化能力和鲁棒性,提高意图分类的准确性和稳定性,确保在各种复杂场景下的有效应用。
41、(5)自动化与智能化程度高:整个处理流程从弹幕采集、意图分类到自动回复的生成与发送,均实现了高度的自动化和智能化。这不仅降低了人工操作的复杂性和错误率,还大大提高了处理效率,使直播弹幕管理更加便捷和高效。
42、(6)时间戳标记与精准分析:对采集的弹幕问题信息进行时间戳标记,使得系统能够准确记录每条弹幕的发送时间,为后续的意图分类和回复生成提供了精确的时间依据,确保了分析的准确性和时效性。
43、(7)定时器机制与高效缓存:通过初始化定时器并设定固定的时间间隔来捕获和缓存直播过程中的弹幕问题信息,本发明实现了对弹幕数据的实时处理和高效缓存,避免了数据丢失和延迟处理的问题,确保了系统的高可用性和稳定性。
1.一种直播弹幕问题的处理方法,其特征在于,所述方法包括以下步骤:
2.根据权利要求1所述的直播弹幕问题的处理方法,其特征在于,在步骤s2中,利用基于bert的意图分类模型对所述弹幕内容进行意图分类,具体包括以下子步骤:
3.根据权利要求2所述的直播弹幕问题的处理方法,其特征在于,在步骤s23中,训练过程中采用focal loss作为损失函数,以及在开源bert模型基础上引入fgm对抗训练技术。
4.根据权利要求1所述的直播弹幕问题的处理方法,其特征在于,还包括:s4、根据所述弹幕意图分类结果,结合预设的回复规则,自动生成回复内容,并将所述回复内容发送至直播界面。
5.根据权利要求1所述的直播弹幕问题的处理方法,其特征在于,在步骤s1中,采集直播过程中的弹幕问题信息,还包括对采集的弹幕问题信息进行时间戳标记,获得所述弹幕发送时间。
6.根据权利要求1所述的直播弹幕问题的处理方法,其特征在于,还包括以下步骤:
7.根据权利要求1所述的直播弹幕问题的处理方法,其特征在于,在步骤s3中,基于所述观众会话id判断是否有新观众进入直播间以及提问意图在之前是否被回答过,具体通过以下方式进行检测:
8.一种直播弹幕问题的处理系统,其特征在于,所述系统包括:
9.一种终端设备,其特征在于,包括处理器、存储器以及存储在所述存储器内的计算机程序,所述计算机程序被所述处理器执行以实现如权利要求1至7中任意一项所述的直播弹幕问题的处理方法。
10.一种计算机可读存储介质,所述介质中存储有计算机程序,在所述计算机程序被处理器执行时,实施如权利要求1至7中任意一项所述的直播弹幕问题的处理方法。
