一种用于压力检测的词嵌入方法及装置

allin2024-12-30  84



1.本发明涉及自然语言处理技术领域,尤其涉及一种用于压力检测的词嵌入方法及装置。


背景技术:

2.压力是心理压力源和心理压力反应共同构成的一种认知和行为体验过程。随着经济社会的不断发展,人们的生活节奏越来越快,人们面临的压力越来越大,压力类型也越来越多,现代医学表明,压力会削弱人体免疫力,引发一些疾病,进而影响人们的身心健康。
3.大数据时代的到来和社交媒体的迅速发展,使得微信、微博以及小红书等社交媒体应用平台成为了人们记录生活日常、分享信息以及互动交流的网络媒介,社交媒体应用平台中丰富的用户文本数据,使得通过社交媒体应用平台大数据进行用户日常压力的检测成为可能。
4.现有技术中,大多数方法都是采用自然语言处理和机器学习技术将帖子中每个用户的单词表示为连续的低维和实值向量,即词嵌入,然后以词嵌入表示帖子的内容并构建分类器。由于词嵌入捕捉了单词的句法和语义信息等各个方面的信息,并对在语言环境中具有相似语法用法和语义的单词进行了分组,词嵌入被认为是机器学习的一个关键突破口,特别地,词嵌入可以处理许多自然语言处理任务,例如语言理解、机器翻译和问题回答。
5.然而,已有的通用词嵌入方法并没有显式建模压力源和压力词汇,即现有的通用词嵌入方法并不是专门针对于检测社交媒体应用平台用户的压力,在此基础上,根据通用词嵌入方法对社交媒体应用平台用户的压力进行检测,所得到的检测结果准确性很低。目前还有一些利用生理信号检测用户心理压力的方案,比如心率变异性、心电图、电流皮肤反应、脑电图、血压以及肌电图等,并将其延伸至可穿戴设备,可随时随地监测用户的压力状况。但是生理信号相关数据也存在一些固有的问题,用户的情绪波动很容易影响检测结果,比如,穿戴者在极度兴奋状态和极度压力状态下的生理相关数据时非常相似的,利用生理相关数据有时也无法准确地检测出用户的真实压力状态。
6.因此,如何解决现有技术中尚无显式建模压力源和压力词汇的词嵌入,且压力检测结果准确度低的技术问题,是语言处理技术领域亟待解决的重要课题。


技术实现要素:

7.本发明提供一种用于压力检测的词嵌入方法,用以解决现有技术中尚无显式建模压力源和压力词汇的词嵌入,且压力检测结果准确度低的缺陷,实现各社交媒体应用中用户压力的准确检测。
8.第一方面,本发明提供一种用于压力检测的词嵌入方法,其特征在于,包括:获取目标文本;根据压力源对比任务和压力情绪对比任务,获取基于压力源和压力情绪的语言模型;将所述目标文本输入至所述语言模型,获取压力特定词嵌入;将所述压力特定词嵌入输入至压力检测模型中,得到压力检测结果。
9.进一步地,所述用于压力检测的词嵌入方法还包括:利用联合损失函数对所述基于压力源和压力情绪的语言模型进行训练;所述联合损失函数为:
10.l=λl
sd
+(1-λ)l
sed
11.其中,λ为所述联合损失函数中所述压力源对比任务的权重,l
sd
为所述压力源对比任务的损失函数,l
sed
为所述压力情绪对比任务的损失函数。
12.进一步地,所述利用联合损失函数对所述基于压力源和压力情绪的语言模型进行训练,包括:获取包括压力源和压力情绪的训练文本;根据所述训练文本,设置预设数量的正样本和负样本;将所述训练文本、所述正样本和所述负样本输入至所述压力源对比任务的损失函数和所述压力情绪对比任务的损失函数中,训练所述语言模型至收敛。
13.进一步地,所述根据所述训练文本,设置预设数量的正样本和负样本,包括:将所述训练文本中的压力源词汇或压力情绪词汇用预设词汇进行替换,或将所述训练文本中的压力情绪词汇用积极情绪词汇进行替换,得到所述负样本;随机插入所述特定词汇至所述训练文本中,得到所述正样本。
14.进一步地,所述将所述压力特定词嵌入输出至压力检测模型中,得到压力检测结果,包括:将所述压力特定词嵌入以矩阵的形式输入至双向长短期记忆网络,获取所述目标文本的第一文本表示;将所述第一文本表示输入至推文注意力机制,获取所述目标文本的第二文本表示;将所述第二文本表示输入至用户注意力机制,获取所述目标文本的第三文本表示;将所述第三文本表示输入至全连接层,通过softmax激活函数对所述全连接层的输出结果进行处理,得到所述压力检测结果。
15.进一步地,所述压力检测结果包括压力状态和压力类别。
16.第二方面,本发明还提供一种用于压力检测的词嵌入装置,其特征在于,包括:目标文本获取模块,用于获取目标文本;语言模型获取模块,用于根据压力源对比任务和压力情绪对比任务,获取基于压力源和压力情绪的语言模型;词嵌入获取模块,用于将所述目标文本输入至所述语言模型,获取压力特定词嵌入;压力检测模块,用于将所述压力特定词嵌入输入至压力检测模型中,得到压力检测结果。
17.第三方面,本发明还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述用于压力检测的词嵌入方法的步骤。
18.第四方面,本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述用于压力检测的词嵌入方法的步骤。
19.第五方面,本发明还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述任一种所述用于压力检测的词嵌入方法的步骤。
20.本发明提供的用于压力检测的词嵌入方法,通过根据压力源对比任务和压力情绪对比任务,获取基于压力源和压力情绪的语言模型,并将获取的目标文本输入至语言模型中,得到压力特定词嵌入,将压力特定词嵌入输入至压力检测模型中,即可得到压力检测结果,该方法解决了现有技术中尚无显式建模压力源和压力词汇的词嵌入,且压力检测结果准确度低的缺陷,实现了各社交媒体应用平台中用户压力的准确检测。
附图说明
21.为了更清楚地说明本发明或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
22.图1为本发明提供的用于压力检测的词嵌入方法的流程示意图;
23.图2为本发明提供的压力源对比任务的正负样本示意图;
24.图3为本发明提供的压力情绪对比任务的正负样本示意图;
25.图4为本发明提供的压力检测流程图;
26.图5为本发明提供的用于压力检测的词嵌入装置的结构示意图;
27.图6为本发明提供的电子设备的结构示意图。
具体实施方式
28.为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
29.图1示出了本发明所提供的用于压力检测的词嵌入方法的流程示意图。如图1所示,该用于压力检测的词嵌入方法包括:
30.s101,获取目标文本。
31.可以理解的是,在进行压力检测之前,必要的步骤之一便是获取用于检测用户压力的目标文本,其中,目标文本可以来源于各大社交媒体应用平台,例如微博、微信、qq和小红书;也可以来源书籍、文章或日记;还可以是来源于任何其他可用的文本内容。具体地,以微博为例,任一微博用户的任一条博文均可以作为目标文本被获取,目标文本中可以包括与压力相关的词汇,也可以不包括任何与压力相关的词汇。
32.还需要说明的是,目标文本的具体内容可以是汉字,也可以是英文,在此不作具体限定。
33.s102,根据压力源对比任务和压力情绪对比任务,获取基于压力源和压力情绪的语言模型。
34.可以理解的是,压力是压力源和心理压力反应共同构成的一种认知和体验过程,形成压力的源头是压力源,例如经济、学习、工作和家庭,而有了压力便会产生压力情绪,例如焦虑、开心以及难过等情绪。再例如,在微博博文“下周期末考试,我感觉很焦虑”中,考试是压力源,焦虑是压力情绪。
35.为了实现对不同社交媒体应用平台的用户压力的准确检测,可以根据与压力有着紧密联系的压力源和压力情绪,分别设置相应的两组对比任务,即压力源对比任务和压力情绪对比任务,根据这两组对比任务,可以得到与压力源和压力情绪相关的语言模型。
36.其中,压力源对比任务和压力情绪对比任务的载体可以为神经网络模型,即通过训练基于压力源的神经网络和基于压力情绪的神经网络,使得语言模型能够理解何为压力源,以及何为压力情绪。
37.语言模型用于对一段文本的概率进行估计,即针对目标文本,计算目标文本的概率。具体地,通过压力源对比任务和压力情绪对比任务,可以使得语言模型能够理解何为压力源,以及何为压力情绪,在此基础上,获取得到的基于压力源和压力情绪的语言模型能够很好地预测与压力相关的词汇。
38.s103,将目标文本输入至语言模型,获取压力特定词嵌入。
39.可以理解的是,在前述步骤获取目标文本和得到基于压力源和压力情绪的语言模型的基础上,将目标文本输入至语言模型中,即可得到输出的压力特定词嵌入。
40.词嵌入是指将一个维数为所有词的数量的高维空间嵌入到一个维数低得多的连续向量空间中,每个单词或词组被映射为实数域上的向量。例如,目标文本为“猫和狗的爱情”,若“猫”、“狗”和“爱情”对应的向量分别为(0.1,0.2,0.3)、(0.2,0.2,0.4)和(0.5,0.5,-0.7),那么从目标文本中若干单词到相应向量的映射过程即为词嵌入。
41.压力特定词嵌入是指该词嵌入主要针对于压力检测方面的,而现有的通用词嵌入方法尚且没有专门用于检测压力的词嵌入方法。
42.s104,将压力特定词嵌入输入至压力检测模型中,得到压力检测结果。
43.可以理解的是,在上一步骤将目标文本输入至语言模型,得到压力特定词嵌入的基础上,将得到的压力特定词嵌入输入至构建的压力检测模型中,压力检测模型输出相应的压力检测结果。
44.其中,压力检测结果的具体内容可根据实际需要进行设置,譬如,压力检测结果可以包括目标文本的所属用户是否有压力、造成该用户产生压力的原因以及目前用户的压力情绪。
45.在一个具体的实施例中,压力检测结果包括压力状态和压力类别,其中,压力状态检测为二分类,即压力状态为0,则表示该用户无压力;压力状态为1,则表示该用户存在压力。压力类别检测为六分类,即压力类别为0、1、2、3、4和5,分别对应“经济”、“学校”、“工作”、“失业”、“责任”以及“未知”。
46.在本实施例中,通过根据压力源对比任务和压力情绪对比任务,获取基于压力源和压力情绪的语言模型,并将获取的目标文本输入至语言模型中,得到压力特定词嵌入,将压力特定词嵌入输入至压力检测模型中,即可得到压力检测结果,该方法解决了现有技术中尚无显式建模压力源和压力词汇的词嵌入,且压力检测结果准确度低的缺陷,实现了各社交媒体应用平台中用户压力的准确检测。
47.在上述实施例的基础上,进一步地,该用于压力检测的词嵌入方法还包括:利用联合损失函数对基于压力源和压力情绪的语言模型进行训练;联合损失函数为:
48.l=λl
sd
+(1-λ)l
sed
49.其中,λ为联合损失函数中压力源对比任务的权重,l
sd
为压力源对比任务的损失函数,l
sed
为压力情绪对比任务的损失函数。
50.可以理解的是,根据压力源对比任务和压力情绪对比任务,得到基于压力源和压力情绪的语言模型,将目标文本输入至该语言模型中,即可获取压力特定词嵌入,再将压力特定词嵌入输入到压力检测模型中,即可获取相应的压力检测结果。明显地,压力检测结果的准确程度,与语言模型输出的压力特定词嵌入有着紧密联系,而压力特定词嵌入又与语言模型的预测效果息息相关,从而,如何提高语言模型的预测效果至关重要。
51.考虑及此,最直接的解决方式便是对基于压力源和压力情绪的语言模型进行训练,将其训练至收敛,以保证语言模型的预测效果。
52.在本实施例中,可以通过联合损失函数对该语言模型进行训练,联合损失函数的公式如下:
53.l=λl
sd
+(1-λ)l
sed
54.其中,λ为联合损失函数中压力源对比任务的权重,可根据实际情况进行设置,l
sd
为压力源对比任务的损失函数,l
sed
为压力情绪对比任务的损失函数。在一个具体的实施例中,联合损失函数中压力源对比任务的权重为0.6,压力情绪对比任务的权重为0.4。
55.具体地,压力源对比任务的损失函数的公式如下:
[0056][0057]
其中,s表示原始的包括压力源的目标文本,s
+
表示正样本,si表示正样本和负样本,i和k表示正样本和负样本总的数量,τ为温度参数,用于调节对困难样本的关注程度,即温度参数越小,则越关注于将相应的目标文本、正样本和负样本与最相似的困难样本分开,从而得到更均匀的表示,
[0058]
压力情绪对比任务的损失函数的公式如下:
[0059][0060]
其中,e表示原始的包括压力情绪的目标文本,e
+
表示正样本,ei表示正样本和负样本.
[0061]
在本实施例中,通过利用联合损失函数对基于压力源和压力情绪的语言模型进行训练,使得语言模型的预测效果更佳,根据语言模型输出的压力特定词嵌入,能够获取得到更准确的压力检测结果。
[0062]
在上述实施例的基础上,进一步地,利用联合损失函数对基于压力源和压力情绪的语言模型进行训练,包括:获取包括压力源和压力情绪的训练文本;根据训练文本,设置预设数量的正样本和负样本;将训练文本、正样本和负样本输入至压力源对比任务的损失函数和压力情绪对比任务的损失函数中,训练语言模型至收敛。
[0063]
根据训练文本,设置预设数量的正样本和负样本,具体包括:将训练文本中的压力源词汇或压力情绪词汇用预设词汇进行替换,或将训练文本中的压力情绪词汇用积极情绪词汇进行替换,得到负样本;随机插入特定词汇至训练文本中,得到正样本。
[0064]
可以理解的是,为了得到压力特定词嵌入,本实施例通过同时训练压力源对比任务和压力情绪对比任务,使得语言模型理解压力源和压力情绪。
[0065]
为了更好地理解,以下分别对压力源对比任务和压力情绪对比任务的训练展开描述。
[0066]
压力源对比任务可以为一个基于压力源的网络模型,为了能够更好的理解压力源,需要对压力源对比任务进行训练,其中,在训练过程中使用的损失函数为压力源对比任务的损失函数。
[0067]
利用联合损失函数对语言模型进行训练,具体地,获取包括压力源的训练文本,根
据该训练文本,分别设置预设数量的正样本和负样本,然后将训练文本、正样本以及负样本输入至压力源对比任务的损失函数中,即可得到训练好的压力源对比任务。
[0068]
根据训练文本,设置预设数量的正样本和负样本,具体地,在得到训练文本后,将训练文本中的压力源词汇用预设词汇进行替换,即可得到负样本;在训练文本中随机插入特定词汇,即可得到正样本。
[0069]
需要说明的是,对于预设数量的正样本和负样本,正样本和负样本的数量可以相同,也可以不同,预设数量可根据实际数量进行设置。例如,在一个具体的实施例中,对于一份包括压力源的训练文本,设置了一个负样本和一个正样本。
[0070]
图2示出了本发明所提供的压力源对比任务的正负样本示意图,根据获取的目标文本、压力源对比任务的正负样本以及图3中压力情绪对比任务的正负样本,可对图1中的语言模型进行训练。
[0071]
如图2所示,对于一篇包含压力源的目标文本“thinking of the assignments and final exams,i feel very anxious and stressful.i can’t stand it.”,设置了一个正样本(即图2中的“positive sample”)和一个负样本(即图2中的“negative sample”),负样本和正样本之间是目标文本的原始内容。
[0072]
具体地,将压力源词汇“assignments”和“exams”用特定词汇[mask]替换后的博文设置为负样本,将两个[mask]随机插入原微博文本得到的微博文本设置为正样本,将原微博文本、设置好的正样本以及负样本输入至前述压力源对比任务的损失函数中,即完成对压力源对比任务的一次训练。
[0073]
以同样的方式对获取的所有包含压力源的训练文本进行处理,不断地对压力源对比任务进行训练,以获取训练好的压力源对比任务。
[0074]
类似地,压力情绪对比任务可以为一个基于压力情绪的网络模型,为了能够更好的理解压力情绪,需要对压力情绪对比任务进行训练,其中,在训练过程中使用的损失函数为压力情绪对比任务的损失函数。
[0075]
利用联合损失函数对语言模型进行训练,具体地,获取包括压力情绪的训练文本,根据该训练文本,分别设置预设数量的正样本和负样本,然后将训练文本、正样本以及负样本输入至压力情绪对比任务的损失函数中,即可得到训练好的压力情绪对比任务。
[0076]
根据训练文本,设置预设数量的正样本和负样本,具体地,在得到训练文本后,将训练文本中的压力情绪词汇用预设词汇进行替换,或者将训练文本中的压力情绪词汇用积极情绪词汇进行替换,即可得到负样本;在训练文本中随机插入特定词汇,即可得到正样本。
[0077]
同样地,对于预设数量的正样本和负样本,正样本和负样本的数量可以相同,也可以不同,预设数量可根据实际数量进行设置。例如,在一个具体的实施例中,对于一份包括压力情绪的训练文本,设置了两个负样本和一个正样本。
[0078]
图3示出了本发明所提供的压力情绪对比任务的正负样本示意图,根据获取的目标文本、压力情绪对比任务的正负样本以及图2中压力源对比任务的正负样本,可对图1中的语言模型进行训练。
[0079]
如图3所示,对于一篇包含压力情绪的目标文本,设置了一个正样本(即图3中的“positive sample”)和两个负样本(即图3中的两个“negative sample”)。
[0080]
具体地,将压力情绪词汇“anxious”和“stressful”用特定词汇[mask]替换后的博文,以及将压力情绪词汇“anxious”和“stressful”用积极情绪词汇“happy”和“relaxed”替换后的博文设置为负样本,将两个[mask]随机插入原微博文本得到的微博文本设置为正样本,将原微博文本、设置好的正样本以及负样本输入至前述压力情绪对比任务的损失函数中,即完成对压力情绪对比任务的一次训练。
[0081]
以同样的方式对获取的所有包含压力情绪的训练文本进行处理,不断地对压力情绪对比任务进行训练,以获取训练好的压力情绪对比任务。
[0082]
需要注意的是,对上述在描述压力源对比任务的训练或压力情绪对比任务的训练时,由于仅涉及单一的压力源或压力情绪对比任务的训练,故获取的训练文本仅包含压力源或压力情绪。但在实际使用中,压力源对比任务和压力情绪对比任务的训练是同时进行的,因此,获取的训练文本须同时包含压力源和压力情绪。
[0083]
在本实施例中,通过获取包括压力源和压力情绪的训练文本,并根据训练文本设置预设数量的正样本和负样本,将训练文本、设置好的正样本和负样本输入至压力源对比任务的损失函数和压力情绪对比任务的损失函数中,将基于压力源和压力情绪的语言模型训练至收敛,使得语言模型的预测效果更佳,进一步地,根据语言模型输出的压力特定词嵌入,能够获取得到更准确的压力检测结果。
[0084]
在上述实施例的基础上,图4示出了本发明所提供的压力检测流程图,进一步细化了图1中将压力特定词嵌入输入至压力检测模型中,以获取压力检测结果的过程。如图4所示,将压力特定词嵌入输出至压力检测模型中,得到压力检测结果,包括:将压力特定词嵌入以矩阵的形式输入至双向长短期记忆网络,获取目标文本的第一文本表示;将第一文本表示输入至推文注意力机制,获取目标文本的第二文本表示;将第二文本表示输入至用户注意力机制,获取目标文本的第三文本表示;将第三文本表示输入至全连接层,通过softmax激活函数对全连接层的输出结果进行处理,得到压力检测结果。
[0085]
可以理解的是,为了能够准确检测社交媒体应用用户的压力,设计了压力检测模型,该压力检测模型由双向长短期记忆网络、推文注意力机制以及用户注意力机制构成。
[0086]
具体地,获取目标文本,并将该目标文本输入至语言模型中,得到压力特定词嵌入,将该压力特定词嵌入中的单词用矩阵表示,将得到的矩阵输入至双向长短期记忆网络中,以获取目标文本的第一文本表示。
[0087]
例如,将压力特定词嵌入用矩阵的形式表示为x=[x1,x2,x3,
……
,xn],将x输入至双向长短期记忆网络中,获得目标文本的第一文本表示:h={h1,h2,h3,
……
,hn},h∈rn×
2d
,其中,r为实数,n为目标文本的长度,d为输出的维度,即双向长短期记忆网络输出的向量的维度,可根据实际需求对其进行设置。在一个具体的实施例中,双向长短期记忆网络输出的向量的维度d为256。
[0088]
为了使语言模型能够关注社交媒体应用平台用户发布的言论中的与压力相关的表示,比如一些与压力源或压力情绪相关的单词,在双向长短期记忆网络的基础上,增加了推文注意力机制。
[0089]
具体地,推文注意力机制的表示如下:
[0090]
α=softmax(hw
α
+b
α
)
[0091]
p=α
th[0092]
其中,h为目标文本的第一文本表示,w
α
∈r
2d1
×1和b
α
为训练参数,α∈rn×1表示h的注意力向量,p∈r1×
2d1
为目标文本的第二文本表示,r1×
2d1
为推文注意力机制输出的向量的维度,可根据实际需求对其进行设置。在一个具体的实施例中,推文注意力机制输出的向量的维度r1×
2d1
为1*512。
[0093]
例如,在前述得到目标文本的第一文本表示h的基础上,将h输入至推文注意力机制中,即可得到关于目标文本的第二文本表示:p={p1,p2,p3,
……
,pn},p∈rm×
2d1
,其中,m为一次训练可输入目标文本的最大数量。
[0094]
为了使语言模型能够关注社交媒体应用平台用户发布的言论中的与压力相关的表示,在双向长短期记忆网络和推文注意力机制的基础上,还设置了用户注意力机制。
[0095]
具体地,用户注意力机制的表示如下:
[0096]
β=softmax(pw
β
+b
β
)
[0097]
u=β
t
p
[0098]
其中,p为目标文本的第二文本表示,w
β
∈r
2d2
×1和b
β
为训练参数,β∈rm×1表示p的注意力向量,u∈r1×
2d2
为目标文本的第三文本表示,r1×
2d2
为用户注意力机制输出的向量的维度,可根据实际需求对其进行设置。在一个具体的实施例中,用户注意力机制输出的向量的维度r1×
2d2
为1*512。
[0099]
根据用户注意力机制得到目标文本的第三文本表示后,将其输入至语言模型的全连接层中,用以减少维度到类别数。例如,语言模型最后输出的压力检测结果为压力状态和压力类别,设置压力状态为二分类,设置压力类别为六分类,而用户注意力机制的输出是一个高维度的向量,将用户注意力机制的输出,作为全连接层的输入,使全连接层输出与类别数维度相对应的向量,即减少维度到类别数。
[0100]
最后,利用softmax激活函数对全连接层的输出结果进行分类,从而输出相应的压力检测结果。经过softmax处理得到的压力检测结果,是压力类别或压力状态中每一个结果出现的概率,所有的概率之和为1,从而可以根据概率的大小对相关用户的压力状态和压力类别进行选择和分析。
[0101]
在本实施例中,通过将压力特定词嵌入分别依次输入至语言模型的双向长短期记忆网络、推文注意力机制、用户注意力机制以及全连接层,最后使用softmax激活函数对全连接层的输出结果进行处理,得到压力检测结果,语言模型的构成及具体设置使得该模型更关注与压力相关的表示,从而获取高准确度的压力检测结果。
[0102]
另外,在一个具体的实施例中,还对本发明涉及的各个参数和变量的具体维度进行了设置,具体如下表:
[0103][0104][0105]
图5示出了本发明所提供的用于压力检测的词嵌入装置的结构示意图。如图5所示,该用于压力检测的词嵌入装置包括:目标文本获取模块501,用于获取目标文本;语言模型获取模块502,用于根据压力源对比任务和压力情绪对比任务,获取基于压力源和压力情绪的语言模型;词嵌入获取模块503,用于将所述目标文本输入至所述语言模型,获取压力特定词嵌入;压力检测模块504,用于将所述压力特定词嵌入输入至压力检测模型中,得到压力检测结果。
[0106]
本发明所提供的用于压力检测的词嵌入装置,与上文描述的用于压力检测的词嵌入方法可相互对应参照,在此不再赘述。
[0107]
在本实施例中,通过语言模型获取模块502根据压力源对比任务和压力情绪对比任务,获取基于压力源和压力情绪的语言模型,词嵌入获取模块503将目标文本获取模块501获取的目标文本输入至语言模型中,得到压力特定词嵌入,压力检测模型504将压力特定词嵌入输入至压力检测模型中,即可得到压力检测结果,该装置解决了现有技术中尚无显式建模压力源和压力词汇的词嵌入,且压力检测结果准确度低的缺陷,实现了各社交媒体应用平台中用户压力的准确检测。
[0108]
图6示例了一种电子设备的实体结构示意图,如图6所示,该电子设备可以包括:处理器(processor)610、通信接口(communications interface)620、存储器(memory)630和通信总线640,其中,处理器610,通信接口620,存储器630通过通信总线640完成相互间的通信。处理器610可以调用存储器630中的逻辑指令,以执行用于压力检测的词嵌入方法,该方法包括:获取目标文本;根据压力源对比任务和压力情绪对比任务,获取基于压力源和压力情绪的语言模型;将所述目标文本输入至所述语言模型,获取压力特定词嵌入;将所述压力特定词嵌入输入至压力检测模型中,得到压力检测结果。
[0109]
此外,上述的存储器630中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom,read-only memory)、随机存取存储器(ram,random access memory)、磁碟或者光盘等各种可以存储程序代码的介质。
[0110]
另一方面,本发明还提供一种计算机程序产品,所述计算机程序产品包括计算机程序,计算机程序可存储在非暂态计算机可读存储介质上,所述计算机程序被处理器执行时,计算机能够执行上述各方法所提供的用于压力检测的词嵌入方法,该方法包括:获取目标文本;根据压力源对比任务和压力情绪对比任务,获取基于压力源和压力情绪的语言模型;将所述目标文本输入至所述语言模型,获取压力特定词嵌入;将所述压力特定词嵌入输入至压力检测模型中,得到压力检测结果。
[0111]
又一方面,本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各方法提供的用于压力检测的词嵌入方法,该方法包括:获取目标文本;根据压力源对比任务和压力情绪对比任务,获取基于压力源和压力情绪的语言模型;将所述目标文本输入至所述语言模型,获取压力特定词嵌入;将所述压力特定词嵌入输入至压力检测模型中,得到压力检测结果。
[0112]
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
[0113]
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上
述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如rom/ram、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
[0114]
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

技术特征:
1.一种用于压力检测的词嵌入方法,其特征在于,包括:获取目标文本;根据压力源对比任务和压力情绪对比任务,获取基于压力源和压力情绪的语言模型;将所述目标文本输入至所述语言模型,获取压力特定词嵌入;将所述压力特定词嵌入输入至压力检测模型中,得到压力检测结果。2.根据权利要求1所述的用于压力检测的词嵌入方法,其特征在于,还包括:利用联合损失函数对所述基于压力源和压力情绪的语言模型进行训练;所述联合损失函数为:l=λl
sd
+(1-λ)l
sed
其中,λ为所述联合损失函数中所述压力源对比任务的权重,l
sd
为所述压力源对比任务的损失函数,l
sed
为所述压力情绪对比任务的损失函数。3.根据权利要求2所述的用于压力检测的词嵌入方法,其特征在于,所述利用联合损失函数对所述基于压力源和压力情绪的语言模型进行训练,包括:获取包括压力源和压力情绪的训练文本;根据所述训练文本,设置预设数量的正样本和负样本;将所述训练文本、所述正样本和所述负样本输入至所述压力源对比任务的损失函数和所述压力情绪对比任务的损失函数中,训练所述语言模型至收敛。4.根据权利要求3所述的用于压力检测的词嵌入方法,其特征在于,所述根据所述训练文本,设置预设数量的正样本和负样本,包括:将所述训练文本中的压力源词汇或压力情绪词汇用预设词汇进行替换,或将所述训练文本中的压力情绪词汇用积极情绪词汇进行替换,得到所述负样本;随机插入所述特定词汇至所述训练文本中,得到所述正样本。5.根据权利要求1所述的用于压力检测的词嵌入方法,其特征在于,所述将所述压力特定词嵌入输出至压力检测模型中,得到压力检测结果,包括:将所述压力特定词嵌入以矩阵的形式输入至双向长短期记忆网络,获取所述目标文本的第一文本表示;将所述第一文本表示输入至推文注意力机制,获取所述目标文本的第二文本表示;将所述第二文本表示输入至用户注意力机制,获取所述目标文本的第三文本表示;将所述第三文本表示输入至全连接层,通过softmax激活函数对所述全连接层的输出结果进行处理,得到所述压力检测结果。6.根据权利要求1-5中任一项所述的用于压力检测的词嵌入方法,其特征在于,所述压力检测结果包括压力状态和压力类别。7.一种用于压力检测的词嵌入装置,其特征在于,包括:目标文本获取模块,用于获取目标文本;语言模型获取模块,用于根据压力源对比任务和压力情绪对比任务,获取基于压力源和压力情绪的语言模型;词嵌入获取模块,用于将所述目标文本输入至所述语言模型,获取压力特定词嵌入;压力检测模块,用于将所述压力特定词嵌入输入至压力检测模型中,得到压力检测结果。8.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运
行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至6任一项所述用于压力检测的词嵌入方法的步骤。9.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6任一项所述用于压力检测的词嵌入方法的步骤。10.一种计算机程序产品,包括计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6任一项所述用于压力检测的词嵌入方法的步骤。

技术总结
本发明提供一种用于压力检测的词嵌入方法及装置,其中的词嵌入方法包括:获取目标文本;根据压力源对比任务和压力情绪对比任务,获取基于压力源和压力情绪的语言模型;将目标文本输入至语言模型,获取压力特定词嵌入;将压力特定词嵌入输入至压力检测模型中,得到压力检测结果。该方法解决了现有技术中尚无显式建模压力源和压力词汇的词嵌入,且压力检测结果准确度低的缺陷,实现了各社交媒体应用平台中用户压力的准确检测。中用户压力的准确检测。中用户压力的准确检测。


技术研发人员:冯铃 王鑫
受保护的技术使用者:清华大学
技术研发日:2022.03.14
技术公布日:2022/7/4
转载请注明原文地址: https://www.8miu.com/read-18074.html

最新回复(0)