一种情感极性的分析方法、装置、设备及可读存储介质与流程

allin2024-06-15  85



1.本技术涉及数据处理技术领域,尤其涉及一种情感极性的分析方法、装置、设备及可读存储介质。


背景技术:

2.社交媒体(social media)是人们用来创作、分享、交流意见、观点及经验的虚拟社区和网络平台。因此社交媒体上产生了大量的用户参与的、对于诸如人物、事件、产品等有价值的言论,这些言论表达了人们的各种情感色彩和情感倾向性,如喜、怒、哀、乐和批评、赞扬等。基于此,通过对言论的情感极性分析有助于获取大众舆论对于某一对象(事件或产品)的看法。
3.由于社交媒体产生的言论具有更新快、个性化、且口语化的特点,传统的情感极性分析方法的效率低且准确度低,因此,如何提高情感极性分析方法的效率和准确度是本领域技术人员亟待解决的技术问题。


技术实现要素:

4.本技术提供了一种情感极性的分析方法、装置、设备及可读存储介质,如下:
5.获取多条待分析文本,所述待分析文本为与所述待分析对象相关的文本;
6.将所述待分析文本输入至情感分析模型,得到所述情感分析模型输出的所述待分析文本的情感极性,所述情感极性为预设极性中的一项,所述预设极性包括正面、中性、和负面;
7.其中,所述情感分析模型包括特征提取模型和神经网络模型,所述特征提取模型用于生成所述待分析文本的特征向量,所述神经网络模型用于以所述待分析文本的特征向量为输入,输出所述待分析文本的情感极性;
8.依据每一所述待分析文本的情感极性,获取所述待分析对象的情感分析结果,所述情感分析结果包括情感极性。
9.可选地,情感分析模型还包括:
10.编码模型,所述编码模型用于获取所述待分析文本的文本向量,所述编码模型包括glove模型;
11.所述特征提取模型为lstm模型,所述神经网络模型为卷积神经网络模型;所述lstm模型用于提取所述待分析文本的文本向量的长距离特征,生成并输出所述待分析文本的特征向量,所述特征提取模型包括lstm模型。
12.可选地,在所述将所述待分析文本输入至情感分析模型,得到所述情感分析模型的输出的所述待分析文本的情感极性之前,还包括:
13.获取与所述待分析文本有关联关系的预设文本作为样本文本;
14.基于预设的极性词典,获取所述样本文本的情感极性;
15.将所述样本文本输入至所述情感分析模型的初始模型,以所述样本文本的情感极
性作为目标输出,训练所述初始模型,得到所述情感分析模型。
16.可选地,极性词典包括预设词、词属性、和极性值的对应关系,所述词属性包括肯定词、否定词、和中性词;
17.所述基于预设的极性词典,获取所述样本文本的情感极性,包括:
18.对所述样本文本进行预设的预处理,得到所述样本文本的分词集合,所述分词集合包括至少一个分词,所述预处理包括数据清理和分词操作;
19.依据所述分词的词属性,从所述极性词典中查询得到所述分词的极性值;
20.依据各个所述分词的极性值,计算得到所述样本文本的极性值;
21.依据所述样本文本的极性值,获取所述样本文本的情感极性。
22.可选地,获取多条待分析文本,包括:
23.获取所述待分析对象的关键信息,所述关键信息包括名称和对象属性;
24.利用网络爬虫,获取预设的社交媒体发布的文本中,满足预设的爬取规则的文本作为待分析文本,所述爬取规则包括:包含所述关键信息且热度大于预设的热度阈值。
25.可选地,依据每一所述待分析文本的情感极性,获取所述待分析对象的情感分析结果,包括:
26.获取各个所述情感极性的预设的度量值;
27.获取各个所述待分析文本的情感极性的度量值的统计值,所述统计值包括算数平均值、加权平均值、和众数中的任意一项;
28.依据所述统计值,确定所述待分析对象的情感极性。
29.可选地,情感分析结果还包括任意一个情感极性的特征词和特征类型;所述依据每一所述待分析文本的情感极性,获取所述待分析对象的情感分析结果,还包括:
30.提取第一类文本的关键词,所述第一类文本为情感极性为第一极性的待分析文本,所述第一极性为任意一个情感极性;
31.将词频大于预设的词频阈值的关键词,作为所述第一极性的特征词;
32.对所有所述关键词进行聚类,得到至少一个关键词集合和所述关键词集合的类型,将所述关键词集合的类型作为所述第一极性的特征类型。
33.一种情感极性的分析装置,包括:
34.文本获取单元,用于获取多条待分析文本,所述待分析文本为与所述待分析对象相关的文本;
35.模型预测单元,用于将所述待分析文本输入至情感分析模型,得到所述情感分析模型输出的所述待分析文本的情感极性,所述情感极性为预设极性中的一项,所述预设极性包括正面、中性、和负面;
36.其中,所述情感分析模型包括特征提取模型和神经网络模型,所述特征提取模型用于生成所述待分析文本的特征向量,所述神经网络模型用于以所述待分析文本的特征向量为输入,输出所述待分析文本的情感极性;
37.分析结果获取单元,用于依据每一所述待分析文本的情感极性,获取所述待分析对象的情感分析结果,所述情感分析结果包括情感极性。
38.一种情感极性的分析设备,包括:存储器和处理器;
39.所述存储器,用于存储程序;
40.所述处理器,用于执行所述程序,实现情感极性的分析方法的各个步骤。
41.一种可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时,实现情感极性的分析方法的各个步骤。
42.由上述技术方案可以看出,本技术实施例提供的一种情感极性的分析方法、装置、设备及可读存储介质,获取多条待分析文本,将待分析文本输入至情感分析模型,得到情感分析模型输出的待分析文本的情感极性,情感极性为预设极性中的一项,预设极性包括正面、中性、和负面。进一步,依据每一待分析文本的情感极性,获取待分析对象的情感分析结果。由于情感分析模型包括特征提取模型和神经网络模型,其中,特征提取模型用于生成待分析文本的特征向量,神经网络模型用于以待分析文本的特征向量为输入,输出待分析文本的情感极性。可见,情感分析模型通过特征提取模型预先生成待分析文本的特征向量,再通过神经网络模型依据特征向量输出结果,提高获取待分析文本的情感极性的准确度和效率,进一步,由于待分析文本为与待分析对象相关的文本,情感分析结果包括情感极性,因此,通过多条待分析文本的情感极性获取的待分析对象的情感极性的准确度高。
附图说明
43.为了更清楚地说明本技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
44.图1为本技术实施例提供的一种情感极性的分析方法的具体实施方式的流程示意图;
45.图2为本技术实施例提供的一种情感分析模型的训练方法的示意图;
46.图3为本技术实施例提供的一种情感极性的分析方法的流程示意图;
47.图4为本技术实施例提供的一种情感极性的分析装置的结构示意图;
48.图5为本技术实施例提供的一种情感极性的分析设备的结构示意图。
具体实施方式
49.下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本技术一部分实施例,而不是全部的实施例。基于本技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本技术保护的范围。
50.需要说明的是,本发明提供的一种情感极性的分析方法、装置、设备及可读存储介质,可用于人工智能领域或金融领域。上述仅为示例,并不对本发明提供的一种情感极性的分析方法、装置、设备及可读存储介质的应用领域进行限定。
51.具体地,本技术实施例提供的一种情感极性的分析方法应用于但不限于对社交媒体产生的公开言论进行舆论分析或对产品进行调研的过程,以对社交媒体产生的公开言论进行舆论分析的应用场景为例,通过对公开言论的情感分析可以得到大众舆论对于特定对象(事件、人物、或地区等),社交媒体的用户对象不同,其公开言论的语种会有所不同,本实施例对此不做限定。本技术实施例提供的一种情感极性的分析方法适用于智能移动设备
(例如智能手机或智能平板)、计算机、或者服务器(单台服务器或服务器集群)。
52.图1为本技术实施例提供的一种情感极性的分析方法的具体实现方法,如图1所示,本方法包括:
53.s101、获取待分析对象的关键信息。
54.本实施例中,关键信息包括名称和对象属性,对象属性包括用于描述待分析对象的特征的词,例如,待分析对象为热门话题,热门话题的对象属性包括涉及的人的名称、代号、以及特定的动作描述词。具体地,在社交媒体上的热门话题为“高空抛物的处罚办法”,则对象属性包括热门话题的关键词“高空抛物”和“处罚”,也包括与“高空抛物的处罚办法”话题相关的小区名称和被抛弃物品等。
55.s102、利用网络爬虫,获取预设的社交媒体发布的文本中,满足预设的爬取规则的文本作为待分析文本。
56.本实施例中,爬取规则包括:包含关键信息且热度大于预设的热度阈值。
57.需要说明的是,社交媒体包括国内社交媒体和/或海外社交媒体,爬取规则依据实际需求预设,可以理解的是,包含关键信息的文本为用于针对待分析对象所发表的言论,热度表征文本的阅读量、点赞量以及收藏量,大于预设的热度阈值的文本更能体现大众对待分析对象的态度。
58.s103、将待分析文本输入至情感分析模型,得到情感分析模型输出的待分析文本的情感极性。
59.本实施例中,情感极性为预设极性中的一项,预设极性包括正面、中性、和负面。需要说明的是,预设极性可以按照程度进一步划分,例如,负面包括批评、厌恶、和憎恶等,本实施例不做限定。
60.本实施例中,情感分析模型包括编码模型、特征提取模型和神经网络模型,特征提取模型用于生成待分析文本的特征向量。编码模型用于获取待分析文本的文本向量,编码模型包括glove(global vectors for word representation,全局词向量)模型。神经网络模型用于以待分析文本的特征向量为输入,输出待分析文本的情感极性。具体地,神经网络模型包括嵌入层,卷积层,最大池层softmax层、和全连接层。其中,卷积层的卷积网络连接至少一个过滤器,例如,卷积网络依次连接过滤深度为3、5、和2的过滤器。每一过滤器用于输出输入向量的关键向量。
61.本实施例中,特征提取模型为lstm(long short-term memory,长短期记忆)模型,神经网络模型为cnn(convolutional neural networks,卷积神经网络)模型。
62.本实施例中,首先对待分析文本进行预设的预处理,预处理包括数据清理(例如,清除和情感相关性较小的的各种杂质,比如标点符号、特殊字符、停用词等、将表情符号替换为词、进行词干提取和断词处理)和分词操作,再将预处理之后的数据作为情感分析模型的输入,提高模型的效率和准确度。
63.本实施例中,以待分析文本为英文文本为例,将待分析文本输入至情感分析模型,得到情感分析模型输出的待分析文本的情感极性的具体方法包括:
64.1、基于glove模型把输入的英文文本映射为256维度的文本向量,可选地,获取英文文本包含的单词的词向量并拼接得到文本向量。
65.2.使用lstm模型对glove模型输出的文本向量提取长距离特征,生成并输出指示
上下文语义的特征向量;
66.3.将lstm模型的输出作为cnn模型的输入,进一步使用cnn模型的卷积层对lstm模型的输出的特征向量进行卷积处理,提取特征向量的特征并使用多个过滤器进行迭代,得到过滤后的特征向量。将过滤后的特征向量作为最大池化层的输入,最大池化层使用dropout正则处理过滤后的特征向量,并输出处理结果至softmax层,进一步通过全连接层,对特征进行分类,输出英文文本的情感极性。
67.需要说明的是,情感分析模型以样本文本为输入,以样本文本的情感极性为目标输出训练得到,在训练过程中迭代优化情感分析模型中各个结构中的参数。具体的一种训练方法参见图3所示的流程。
68.s104、获取各个情感极性的预设的度量值。
69.本实施例中,情感极性的度量值为情感极性的量化值,可选地,度量值越大,正面程度越高。例如,正面的情感极性为1,中性的情感极性为0,负面的情感极性为-1。
70.s105、获取各个待分析文本的情感极性的度量值的统计值,
71.本实施例中,统计值包括算数平均值、加权平均值、和众数中的任意一项。
72.需要说明的是,统计值为加权平均值时,可选地,待分析文本的权值依据待分析文本的长度、待分析文本的来源(社交媒体类型)、或者待分析文本的热度获取,例如,待分析文本的来源的用户数量越大,待分析文本的权值越大,或者,待分析文本的热度越高,待分析文本的权值越大。
73.s106、依据统计值,确定待分析对象的情感极性。
74.具体的,获取情感极性对应的预设的数值范围,将数值范围包含统计值的情感极性作为待分析对象的情感极性。
75.接上例,待分析文本的数量为1000条,其中,情感极性为正面的待分析文本的数量为600条,情感极性为负面的待分析文本的数量为220条,情感极性为中性的待分析文本的数量为180条,则待分析文本的情感极性的度量值的算数平均值为0.38,且正面的情感极性的数值范围为[0.5,1],中性的情感极性的数值范围为[-0.5,0.5],负面的情感极性的数值范围为[-1,0.5]。因此,待分析对象的情感极性为中性。需要说明的是,情感极性的细粒度可以预设,例如,按照负面到正面的规律,将情感极性分为10个等级的极性,具体参见现有技术。
[0076]
s107、提取第一类文本的关键词,将词频大于预设的词频阈值的关键词,作为第一极性的特征词。
[0077]
本实施例中,第一类文本为情感极性为第一极性的待分析文本,第一极性为任意一个情感极性。
[0078]
s108、对所有关键词进行聚类,得到至少一个关键词集合和关键词集合的类型,将关键词集合的类型作为第一极性的特征类型。
[0079]
需要说明的是,第一极性的特征词和第一极性的特征类型从不同维度指示用于对待分析对象产生第一极性指示的情感的原因。例如,待分析对象为冰箱产品,第一极性为负面,第一极性的特征词包括结冰、耗电、以及容量,那么对冰箱产品产生负面的情感的原因与结冰、耗电以及容量相关。第一极性的特征类型为性能,可以理解的是,冰箱产品的性能是对冰箱产品产生负面的情感的原因。
[0080]
s109、将待分析对象的情感极性、每一预设极性的特征类型、每一预设极性的关键词作为待分析对象的情感分析结果,并可视化展示。
[0081]
需要说明的是,可视化的方法参见现有技术,例如,通过图表的方式或者趋势图的方式,具体的可视化方法可以参见现有技术。
[0082]
由上述技术方案可以看出,本实施例提供的一种情感极性的分析方法,由于情感分析模型包括特征提取模型和神经网络模型,其中,特征提取模型用于生成待分析文本的特征向量,神经网络模型用于以待分析文本的特征向量为输入,输出待分析文本的情感极性。可见,情感分析模型通过特征提取模型预先生成待分析文本的特征向量,再通过神经网络模型依据特征向量输出结果,提高获取待分析文本的情感极性的准确度和效率,进一步,由于待分析文本为与待分析对象相关的文本,情感分析结果包括情感极性,因此,通过多条待分析文本的情感极性获取的待分析对象的情感极性的准确度高。
[0083]
进一步,在卷积层设置至少一个过滤器,用于提取关键特征,进一步提高了模型输出的准确性。
[0084]
进一步,利用网络爬虫,获取预设的社交媒体发布的文本中,满足预设的爬取规则的文本作为待分析文本,由于爬取规则包括包含关键信息且热度大于预设的热度阈值,其中关键信息为待分析对象的名称和对象属性,因此,本技术获取的待分析文本是与待分析对象具有强关联关系,且传播较为广泛或影响较大(一般情况下,热度能够指示文本的传播广泛程度或影响程度)。基于此,基于本技术的待分析文本对待分析对象进行情感分析得到的情感分析结果准确度高。
[0085]
进一步,待分析对象的情感分析结果不但包括待分析对象的情感极性,还包括每一预设极性的特征类型以及每一预设极性的关键词作为待分析对象。分析结果更全面,可视化使得分析结果更直观且有益于分析产生不同情感极性的原因。
[0086]
图2示例了一种情感分析模型的训练方法的示意图,如图2所示,包括:
[0087]
s201、获取与待分析文本有关联关系的预设文本作为样本文本。
[0088]
本实施例中,获取与待分析文本有关联关系的预设文本作为样本文本的方法包括:从预设的语料库中,获取符合爬取规则的文本作为样本文本。
[0089]
s202、对样本文本进行预处理,得到样本文本的分词集合。
[0090]
本实施例中,分词集合包括至少一个分词,分词基于对样本文本进行分词操作得到,预处理包括数据清理和分词操作,具体参见上述实施例。
[0091]
s203、依据分词的词属性,从极性词典中查询得到分词的极性值。
[0092]
本实施例中,极性词典预先构建,极性词典包括预设词、词属性、和极性值的对应关系,词属性包括肯定词、否定词、和中性词等。
[0093]
具体地,以英文文本为例,数据标注的过程是斯坦福语料库和专家分析结合。专家分析是英文自然语言处理专家提出的根据否定逻辑关系词如but,nevertheless等,强词包括动词名词,否定词包括none,never等。由此建立一套适用于英文文本情感分析的词典,以此为依据进行打标签数据标注。
[0094]
s204、依据各个分词的极性值,计算得到样本文本的极性值。
[0095]
本实施例中,计算得到样本文本的极性值的方法包括多种,例如,将各个分词的极性值加权相加,得到样本文本的极性值,分词的极性值通过分词的词性、或者在样本文本中
的位置得到。
[0096]
s205、依据样本文本的极性值,获取样本文本的情感极性。
[0097]
本实施例中,将包含极性值的情感极性作为样本文本的情感极性。
[0098]
s206、将样本文本输入至情感分析模型的初始模型,以样本文本的情感极性作为目标输出,训练初始模型,得到情感分析模型。
[0099]
本实施例中,在训练模型的过程中,从样本文本中随机选出80%的数据作为训练集,20%的数据作为测试集,并对训练数据进行交叉验证。具体训练初始模型的过程参见现有技术。
[0100]
需要说明的是,样本文本为与待分析对象相关的文本,提高情感分析模型对于待分析对象的情感分析的准确度,且考虑分词的词属性、词性、和位置获取的样本文本的情感极性的准确度高,更适合社交媒体上口语化表达的文本。
[0101]
图1仅为可选的一种情感极性的分析方法的具体实现方式,本技术实施例提供的一种情感极性的分析方法还包括其他的具体实现方式。
[0102]
例如,情感分析模型的具体结构不限于上述实施例提供的结构,可选地,特征提取模型不限于lstm模型,神经网络模型不限于卷积神经网络模型,编码模型不限于glove模型。
[0103]
再例如,s101~s102为一种可选地获取多条待分析文本的方法,本技术还包括其他的获取多条待分析文本的方法,可选地,爬取规则还包括发布文本的社交媒体的用户数量大于预设阈值。
[0104]
综上,将本技术实施例提供的一种情感极性的分析方法总结概括为图4所示的流程,如图3所示,本方法包括:
[0105]
s301、获取多条待分析文本。
[0106]
本实施例中,待分析文本为与待分析对象相关的文本。与待分析对象相关的文本指的是用于评论或阐述待分析对象的文本。
[0107]
需要说明的是,获取多条待分析文本的具体方法参见上述实施例。
[0108]
s302、将待分析文本输入至情感分析模型,得到情感分析模型输出的待分析文本的情感极性。
[0109]
本实施例中,情感极性为预设极性中的一项,预设极性包括正面、中性、和负面。其中,情感分析模型包括特征提取模型和神经网络模型,特征提取模型用于生成待分析文本的特征向量,神经网络模型用于以待分析文本的特征向量为输入,输出待分析文本的情感极性。
[0110]
需要说明的是,情感分析模型的具体结构包括多种,可选的一种具体结构参见上述实施例。
[0111]
s303、依据每一待分析文本的情感极性,获取待分析对象的情感分析结果。
[0112]
本实施例中,情感分析结果包括情感极性,每一待分析文本均为与待分析对象相关的文本,因此,通过统计待分析文本的情感极性,得到待分析对象的情感极性,例如,将对应的待分析文本的数量最多的情感极性,作为待分析对象的情感极性。
[0113]
由上述技术方案可以看出,本技术实施例提供的情感极性的分析方法,由于情感分析模型包括特征提取模型和神经网络模型,其中,特征提取模型用于生成待分析文本的
特征向量,神经网络模型用于以待分析文本的特征向量为输入,输出待分析文本的情感极性。可见,情感分析模型通过特征提取模型预先生成待分析文本的特征向量,再通过神经网络模型依据特征向量输出结果,提高获取待分析文本的情感极性的准确度和效率,进一步,由于待分析文本为与待分析对象相关的文本,情感分析结果包括情感极性,因此,通过多条待分析文本的情感极性获取的待分析对象的情感极性的准确度高。
[0114]
图4示出了本技术实施例提供的一种情感极性的分析装置的结构示意图,如图4所示,该装置可以包括:
[0115]
文本获取单元401,用于获取多条待分析文本,所述待分析文本为与所述待分析对象相关的文本;
[0116]
模型预测单元402,用于将所述待分析文本输入至情感分析模型,得到所述情感分析模型输出的所述待分析文本的情感极性,所述情感极性为预设极性中的一项,所述预设极性包括正面、中性、和负面;
[0117]
其中,所述情感分析模型包括特征提取模型和神经网络模型,所述特征提取模型用于生成所述待分析文本的特征向量,所述神经网络模型用于以所述待分析文本的特征向量为输入,输出所述待分析文本的情感极性;
[0118]
分析结果获取单元403,用于依据每一所述待分析文本的情感极性,获取所述待分析对象的情感分析结果,所述情感分析结果包括情感极性。
[0119]
可选地,情感分析模型还包括:
[0120]
编码模型,所述编码模型用于获取所述待分析文本的文本向量,所述编码模型包括glove模型;
[0121]
所述特征提取模型为lstm模型,所述神经网络模型为卷积神经网络模型;所述lstm模型用于提取所述待分析文本的文本向量的长距离特征,生成并输出所述待分析文本的特征向量,所述特征提取模型包括lstm模型。
[0122]
可选地,还包括训练单元,用于在所述将所述待分析文本输入至情感分析模型,得到所述情感分析模型的输出的所述待分析文本的情感极性之前,获取与所述待分析文本有关联关系的预设文本作为样本文本;基于预设的极性词典,获取所述样本文本的情感极性;将所述样本文本输入至所述情感分析模型的初始模型,以所述样本文本的情感极性作为目标输出,训练所述初始模型,得到所述情感分析模型。
[0123]
可选地,极性词典包括预设词、词属性、和极性值的对应关系,所述词属性包括肯定词、否定词、和中性词;
[0124]
所述训练单元用于基于预设的极性词典,获取所述样本文本的情感极性,包括:所述训练单元具体用于:
[0125]
对所述样本文本进行预设的预处理,得到所述样本文本的分词集合,所述分词集合包括至少一个分词,所述预处理包括数据清理和分词操作;
[0126]
依据所述分词的词属性,从所述极性词典中查询得到所述分词的极性值;
[0127]
依据各个所述分词的极性值,计算得到所述样本文本的极性值;
[0128]
依据所述样本文本的极性值,获取所述样本文本的情感极性。
[0129]
可选地,文本获取单元用于获取多条待分析文本,包括:文本获取单元具体用于:
[0130]
获取所述待分析对象的关键信息,所述关键信息包括名称和对象属性;
[0131]
利用网络爬虫,获取预设的社交媒体发布的文本中,满足预设的爬取规则的文本作为待分析文本,所述爬取规则包括:包含所述关键信息且热度大于预设的热度阈值。
[0132]
分析结果获取单元,用于依据每一所述待分析文本的情感极性,获取所述待分析对象的情感分析结果,包括:分析结果获取单元具体用于:
[0133]
获取各个所述情感极性的预设的度量值;
[0134]
获取各个所述待分析文本的情感极性的度量值的统计值,所述统计值包括算数平均值、加权平均值、和众数中的任意一项;
[0135]
依据所述统计值,确定所述待分析对象的情感极性。
[0136]
可选地,情感分析结果还包括任意一个情感极性的特征词和特征类型;所述依据每一所述待分析文本的情感极性,获取所述待分析对象的情感分析结果,分析结果获取单元还用于:
[0137]
提取第一类文本的关键词,所述第一类文本为情感极性为第一极性的待分析文本,所述第一极性为任意一个情感极性;
[0138]
将词频大于预设的词频阈值的关键词,作为所述第一极性的特征词;
[0139]
对所有所述关键词进行聚类,得到至少一个关键词集合和所述关键词集合的类型,将所述关键词集合的类型作为所述第一极性的特征类型。
[0140]
图5示出了该情感极性的分析设备的结构示意图,该设备可以包括:至少一个处理器501,至少一个通信接口502,至少一个存储器503和至少一个通信总线504;
[0141]
在本技术实施例中,处理器501、通信接口502、存储器503、通信总线504的数量为至少一个,且处理器501、通信接口502、存储器503通过通信总线504完成相互间的通信;
[0142]
处理器501可能是一个中央处理器cpu,或者是特定集成电路asic(application specific integrated circuit),或者是被配置成实施本发明实施例的一个或多个集成电路等;
[0143]
存储器503可能包含高速ram存储器,也可能还包括非易失性存储器(non-volatile memory)等,例如至少一个磁盘存储器;
[0144]
其中,存储器存储有程序,处理器可执行存储器存储的程序,实现本技术实施例提供的一种情感极性的分析方法的各个步骤,如下:
[0145]
获取多条待分析文本,所述待分析文本为与所述待分析对象相关的文本;
[0146]
将所述待分析文本输入至情感分析模型,得到所述情感分析模型输出的所述待分析文本的情感极性,所述情感极性为预设极性中的一项,所述预设极性包括正面、中性、和负面;
[0147]
其中,所述情感分析模型包括特征提取模型和神经网络模型,所述特征提取模型用于生成所述待分析文本的特征向量,所述神经网络模型用于以所述待分析文本的特征向量为输入,输出所述待分析文本的情感极性;
[0148]
依据每一所述待分析文本的情感极性,获取所述待分析对象的情感分析结果,所述情感分析结果包括情感极性。
[0149]
可选地,情感分析模型还包括:
[0150]
编码模型,所述编码模型用于获取所述待分析文本的文本向量,所述编码模型包括glove模型;
[0151]
所述特征提取模型为lstm模型,所述神经网络模型为卷积神经网络模型;所述lstm模型用于提取所述待分析文本的文本向量的长距离特征,生成并输出所述待分析文本的特征向量,所述特征提取模型包括lstm模型。
[0152]
可选地,在所述将所述待分析文本输入至情感分析模型,得到所述情感分析模型的输出的所述待分析文本的情感极性之前,还包括:
[0153]
获取与所述待分析文本有关联关系的预设文本作为样本文本;
[0154]
基于预设的极性词典,获取所述样本文本的情感极性;
[0155]
将所述样本文本输入至所述情感分析模型的初始模型,以所述样本文本的情感极性作为目标输出,训练所述初始模型,得到所述情感分析模型。
[0156]
可选地,极性词典包括预设词、词属性、和极性值的对应关系,所述词属性包括肯定词、否定词、和中性词;
[0157]
所述基于预设的极性词典,获取所述样本文本的情感极性,包括:
[0158]
对所述样本文本进行预设的预处理,得到所述样本文本的分词集合,所述分词集合包括至少一个分词,所述预处理包括数据清理和分词操作;
[0159]
依据所述分词的词属性,从所述极性词典中查询得到所述分词的极性值;
[0160]
依据各个所述分词的极性值,计算得到所述样本文本的极性值;
[0161]
依据所述样本文本的极性值,获取所述样本文本的情感极性。
[0162]
可选地,获取多条待分析文本,包括:
[0163]
获取所述待分析对象的关键信息,所述关键信息包括名称和对象属性;
[0164]
利用网络爬虫,获取预设的社交媒体发布的文本中,满足预设的爬取规则的文本作为待分析文本,所述爬取规则包括:包含所述关键信息且热度大于预设的热度阈值。
[0165]
可选地,依据每一所述待分析文本的情感极性,获取所述待分析对象的情感分析结果,包括:
[0166]
获取各个所述情感极性的预设的度量值;
[0167]
获取各个所述待分析文本的情感极性的度量值的统计值,所述统计值包括算数平均值、加权平均值、和众数中的任意一项;
[0168]
依据所述统计值,确定所述待分析对象的情感极性。
[0169]
可选地,情感分析结果还包括任意一个情感极性的特征词和特征类型;所述依据每一所述待分析文本的情感极性,获取所述待分析对象的情感分析结果,还包括:
[0170]
提取第一类文本的关键词,所述第一类文本为情感极性为第一极性的待分析文本,所述第一极性为任意一个情感极性;
[0171]
将词频大于预设的词频阈值的关键词,作为所述第一极性的特征词;
[0172]
对所有所述关键词进行聚类,得到至少一个关键词集合和所述关键词集合的类型,将所述关键词集合的类型作为所述第一极性的特征类型。
[0173]
本技术实施例还提供一种可读存储介质,该可读存储介质可存储有适于处理器执行的计算机程序,计算机程序被处理器执行时,实现本技术实施例提供的一种情感极性的分析方法的各个步骤,如下:
[0174]
获取多条待分析文本,所述待分析文本为与所述待分析对象相关的文本;
[0175]
将所述待分析文本输入至情感分析模型,得到所述情感分析模型输出的所述待分
析文本的情感极性,所述情感极性为预设极性中的一项,所述预设极性包括正面、中性、和负面;
[0176]
其中,所述情感分析模型包括特征提取模型和神经网络模型,所述特征提取模型用于生成所述待分析文本的特征向量,所述神经网络模型用于以所述待分析文本的特征向量为输入,输出所述待分析文本的情感极性;
[0177]
依据每一所述待分析文本的情感极性,获取所述待分析对象的情感分析结果,所述情感分析结果包括情感极性。
[0178]
可选地,情感分析模型还包括:
[0179]
编码模型,所述编码模型用于获取所述待分析文本的文本向量,所述编码模型包括glove模型;
[0180]
所述特征提取模型为lstm模型,所述神经网络模型为卷积神经网络模型;所述lstm模型用于提取所述待分析文本的文本向量的长距离特征,生成并输出所述待分析文本的特征向量,所述特征提取模型包括lstm模型。
[0181]
可选地,在所述将所述待分析文本输入至情感分析模型,得到所述情感分析模型的输出的所述待分析文本的情感极性之前,还包括:
[0182]
获取与所述待分析文本有关联关系的预设文本作为样本文本;
[0183]
基于预设的极性词典,获取所述样本文本的情感极性;
[0184]
将所述样本文本输入至所述情感分析模型的初始模型,以所述样本文本的情感极性作为目标输出,训练所述初始模型,得到所述情感分析模型。
[0185]
可选地,极性词典包括预设词、词属性、和极性值的对应关系,所述词属性包括肯定词、否定词、和中性词;
[0186]
所述基于预设的极性词典,获取所述样本文本的情感极性,包括:
[0187]
对所述样本文本进行预设的预处理,得到所述样本文本的分词集合,所述分词集合包括至少一个分词,所述预处理包括数据清理和分词操作;
[0188]
依据所述分词的词属性,从所述极性词典中查询得到所述分词的极性值;
[0189]
依据各个所述分词的极性值,计算得到所述样本文本的极性值;
[0190]
依据所述样本文本的极性值,获取所述样本文本的情感极性。
[0191]
可选地,获取多条待分析文本,包括:
[0192]
获取所述待分析对象的关键信息,所述关键信息包括名称和对象属性;
[0193]
利用网络爬虫,获取预设的社交媒体发布的文本中,满足预设的爬取规则的文本作为待分析文本,所述爬取规则包括:包含所述关键信息且热度大于预设的热度阈值。
[0194]
可选地,依据每一所述待分析文本的情感极性,获取所述待分析对象的情感分析结果,包括:
[0195]
获取各个所述情感极性的预设的度量值;
[0196]
获取各个所述待分析文本的情感极性的度量值的统计值,所述统计值包括算数平均值、加权平均值、和众数中的任意一项;
[0197]
依据所述统计值,确定所述待分析对象的情感极性。
[0198]
可选地,情感分析结果还包括任意一个情感极性的特征词和特征类型;所述依据每一所述待分析文本的情感极性,获取所述待分析对象的情感分析结果,还包括:
[0199]
提取第一类文本的关键词,所述第一类文本为情感极性为第一极性的待分析文本,所述第一极性为任意一个情感极性;
[0200]
将词频大于预设的词频阈值的关键词,作为所述第一极性的特征词;
[0201]
对所有所述关键词进行聚类,得到至少一个关键词集合和所述关键词集合的类型,将所述关键词集合的类型作为所述第一极性的特征类型。
[0202]
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
[0203]
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。
[0204]
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本技术。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本技术的精神或范围的情况下,在其它实施例中实现。因此,本技术将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

技术特征:
1.一种情感极性的分析方法,其特征在于,包括:获取多条待分析文本,所述待分析文本为与所述待分析对象相关的文本;将所述待分析文本输入至情感分析模型,得到所述情感分析模型输出的所述待分析文本的情感极性,所述情感极性为预设极性中的一项,所述预设极性包括正面、中性、和负面;其中,所述情感分析模型包括特征提取模型和神经网络模型,所述特征提取模型用于生成所述待分析文本的特征向量,所述神经网络模型用于以所述待分析文本的特征向量为输入,输出所述待分析文本的情感极性;依据每一所述待分析文本的情感极性,获取所述待分析对象的情感分析结果,所述情感分析结果包括情感极性。2.根据权利要求1所述的方法,其特征在于,所述情感分析模型还包括:编码模型,所述编码模型用于获取所述待分析文本的文本向量,所述编码模型包括glove模型;所述特征提取模型为lstm模型,所述神经网络模型为卷积神经网络模型;所述lstm模型用于提取所述待分析文本的文本向量的长距离特征,生成并输出所述待分析文本的特征向量,所述特征提取模型包括lstm模型。3.根据权利要求2所述的方法,其特征在于,在所述将所述待分析文本输入至情感分析模型,得到所述情感分析模型的输出的所述待分析文本的情感极性之前,还包括:获取与所述待分析文本有关联关系的预设文本作为样本文本;基于预设的极性词典,获取所述样本文本的情感极性;将所述样本文本输入至所述情感分析模型的初始模型,以所述样本文本的情感极性作为目标输出,训练所述初始模型,得到所述情感分析模型。4.根据权利要求3所述的方法,其特征在于,所述极性词典包括预设词、词属性、和极性值的对应关系,所述词属性包括肯定词、否定词、和中性词;所述基于预设的极性词典,获取所述样本文本的情感极性,包括:对所述样本文本进行预设的预处理,得到所述样本文本的分词集合,所述分词集合包括至少一个分词,所述预处理包括数据清理和分词操作;依据所述分词的词属性,从所述极性词典中查询得到所述分词的极性值;依据各个所述分词的极性值,计算得到所述样本文本的极性值;依据所述样本文本的极性值,获取所述样本文本的情感极性。5.根据权利要求1所述的方法,其特征在于,所述获取多条待分析文本,包括:获取所述待分析对象的关键信息,所述关键信息包括名称和对象属性;利用网络爬虫,获取预设的社交媒体发布的文本中,满足预设的爬取规则的文本作为待分析文本,所述爬取规则包括:包含所述关键信息且热度大于预设的热度阈值。6.根据权利要求1所述的方法,其特征在于,所述依据每一所述待分析文本的情感极性,获取所述待分析对象的情感分析结果,包括:获取各个所述情感极性的预设的度量值;获取各个所述待分析文本的情感极性的度量值的统计值,所述统计值包括算数平均值、加权平均值、和众数中的任意一项;依据所述统计值,确定所述待分析对象的情感极性。
7.根据权利要求1所述的方法,其特征在于,所述情感分析结果还包括任意一个情感极性的特征词和特征类型;所述依据每一所述待分析文本的情感极性,获取所述待分析对象的情感分析结果,还包括:提取第一类文本的关键词,所述第一类文本为情感极性为第一极性的待分析文本,所述第一极性为任意一个情感极性;将词频大于预设的词频阈值的关键词,作为所述第一极性的特征词;对所有所述关键词进行聚类,得到至少一个关键词集合和所述关键词集合的类型,将所述关键词集合的类型作为所述第一极性的特征类型。8.一种情感极性的分析装置,其特征在于,包括:文本获取单元,用于获取多条待分析文本,所述待分析文本为与所述待分析对象相关的文本;模型预测单元,用于将所述待分析文本输入至情感分析模型,得到所述情感分析模型输出的所述待分析文本的情感极性,所述情感极性为预设极性中的一项,所述预设极性包括正面、中性、和负面;其中,所述情感分析模型包括特征提取模型和神经网络模型,所述特征提取模型用于生成所述待分析文本的特征向量,所述神经网络模型用于以所述待分析文本的特征向量为输入,输出所述待分析文本的情感极性;分析结果获取单元,用于依据每一所述待分析文本的情感极性,获取所述待分析对象的情感分析结果,所述情感分析结果包括情感极性。9.一种情感极性的分析设备,其特征在于,包括:存储器和处理器;所述存储器,用于存储程序;所述处理器,用于执行所述程序,实现如权利要求1~7中任一项所述的情感极性的分析方法的各个步骤。10.一种可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时,实现如权利要求1~7中任一项所述的情感极性的分析方法的各个步骤。

技术总结
本申请公开了一种情感极性的分析方法、装置、设备及可读存储介质,可应用于金融领域或其他领域。将待分析文本输入至情感分析模型,得到情感分析模型输出的待分析文本的情感极性,情感极性为预设极性中的一项,预设极性包括正面、中性、和负面。进一步,依据每一待分析文本的情感极性,获取待分析对象的情感分析结果。由于情感分析模型包括特征提取模型和神经网络模型,情感分析模型通过特征提取模型预先生成待分析文本的特征向量,再通过神经网络模型依据特征向量输出结果,提高获取待分析文本的情感极性的准确度和效率,由于待分析文本为与待分析对象相关的文本,因此,通过多条待分析文本的情感极性获取的待分析对象的情感极性的准确度高。性的准确度高。性的准确度高。


技术研发人员:朱晓萌
受保护的技术使用者:中银金融科技有限公司
技术研发日:2022.04.07
技术公布日:2022/7/5
转载请注明原文地址: https://www.8miu.com/read-14524.html

最新回复(0)