量子文本识别模型及基于量子计算的文本识别方法与流程

allin2026-01-31  12


本发明属于量子计算,特别是一种量子文本识别模型及基于量子计算的文本识别方法、装置及介质。


背景技术:

1、命名实体识别(named entity recognition,ner)是自然语言处理(nlp)领域的一个基础上游任务,旨在从文本中识别并分类特定类型的实体,这些实体可以是人名、地名、组织名、日期、时间、货币等具有特定意义的词汇单元。

2、在相关技术中,可以采用深度学习模型进行命名实体识别,常见的深度学习模型包括卷积神经网络(cnn)、循环神经网络(rnn)以及长短期记忆网络(lstm)等;这些模型能够自动发现文本中的隐藏特征,从而可以取得很好地识别效果。但是,这些模型针对文本中的隐藏特征的发掘能力有限,在识别过程中,可能会出现准确性不高的现象。

3、而随着双向长短时记忆网络(bidirectional long short-term memory,bilstm)的诞生,bilstm在处理序列数据时同时考虑了过去和未来的上下文信息,从而能够捕捉更全面的语义和依赖关系。bilstm的主要特点是它将输入序列分别从正向和反向两个方向进行处理,然后将这两个方向的输出进行拼接或组合。这样,bilstm的每个时间步都会考虑到过去和未来的上下文信息,从而有助于更好地理解序列数据中的模式和关系,以便于更好地进行命名实体识别。

4、而由于bilstm在处理序列数据时同时考虑了过去和未来的上下文信息,因此,针对信息的处理量较大,使得在进行命名实体识别处理过程中,可能出现处理效率较低的现象。


技术实现思路

1、本发明的目的是提供一种量子文本识别模型及基于量子计算的文本识别方法、装置及介质,以解决现有技术中针对文本识别准备性不高,或者识别效率不高的问题。在本公开中,在获取到待识别文本序列之后,可以将待识别文本序列输入至预先训练完成的量子文本识别模型,而由于量子文本识别模型包括两个记忆网络,两个记忆网络中的第一记忆网络用于正向处理待识别文本序列,两个记忆网络中的第二记忆网络用于反向处理待识别文本序列,这样,可以更好地发现待识别文本序列中各元素之间的隐藏关联性,而且,两个记忆网络中至少一个为量子长短期记忆网络,也可以提升获得待识别文本序列中各元素对应的目标特征信息的效率以及准确性,从而也就可以更高效准确地确定待识别文本序列对应的文本识别结果。

2、第一方面,本技术的一个实施例提供了一种基于量子计算的文本识别方法,上述方法包括:获取待识别文本序列;

3、将上述待识别文本序列输入至预先训练完成的量子文本识别模型,获得上述待识别文本序列中各元素对应的目标特征信息;

4、基于各元素对应的目标特征信息,确定上述待识别文本序列对应的文本识别结果;

5、其中,量子文本识别模型包括两个记忆网络,上述两个记忆网络中至少一个为量子长短期记忆网络;

6、上述两个记忆网络中的第一记忆网络用于正向处理上述待识别文本序列,上述两个记忆网络中的第二记忆网络用于反向处理上述待识别文本序列;

7、其中,上述第一记忆网络的输出与上述第二记忆网络的输出进行拼接处理,获得上述待识别文本序列中各元素对应的目标特征信息。

8、可选的,上述第一记忆网络和上述第二记忆网络的类型均为量子长短期记忆网络。

9、可选的,上述第一记忆网络输出上述待识别文本序列中各元素对应的第一特征信息,上述第二记忆网络输出上述待识别文本序列中各元素对应的第二特征信息;

10、以及,上述第一记忆网络的输出与上述第二记忆网络的输出进行拼接处理,获得上述待识别文本序列中各元素对应的目标特征信息,包括:

11、分别对各元素对应的第一特征信息和第二特征信息进行拼接处理,获得上述待识别文本序列中各元素对应的目标特征信息。

12、可选的,元素的目标特征信息包括用于指示该元素为预定义实体的概率信息;

13、以及,上述基于各元素对应的目标特征信息,确定上述待识别文本序列对应的文本识别结果,包括:

14、基于各元素对应的目标特征信息,确定各元素是否为预定义实体;

15、根据各元素是否为预定义实体的确定结果,为各元素添加相应的实体指示标签。

16、可选的,在上述基于各元素对应的目标特征信息,确定各元素是否为预定义实体之前,上述方法还包括:

17、基于各元素在上述待识别文本序列中的顺序,对各元素对应的目标特征信息中的概率信息进行更新。

18、可选的,上述基于各元素在上述待识别文本序列中的顺序,对各元素对应的目标特征信息中的概率信息进行更新,包括:

19、利用预先定义的条件随机场模型对各元素对应的目标特征信息中的概率信息进行更新。

20、第二方面,本技术的一个实施例提供了提供了一种量子文本识别模型,包括:

21、量子文本识别模型包括两个记忆网络,上述两个记忆网络中至少一个为量子长短期记忆网络;

22、上述两个记忆网络中的第一记忆网络用于正向处理上述待识别文本序列,上述两个记忆网络中的第二记忆网络用于反向处理上述待识别文本序列;

23、其中,上述第一记忆网络的输出与上述第二记忆网络的输出进行拼接处理,获得上述待识别文本序列中各元素对应的目标特征信息。

24、第三方面,本技术的又一实施例提供了一种基于量子计算的文本识别装置,上述装置包括:

25、获取模块,用于获取待识别文本序列;

26、目标特征信息获得模块,用于将上述待识别文本序列输入至预先训练完成的量子文本识别模型,获得上述待识别文本序列中各元素对应的目标特征信息;

27、确定模块,用于基于各元素对应的目标特征信息,确定上述待识别文本序列对应的文本识别结果;

28、其中,量子文本识别模型包括两个记忆网络,上述两个记忆网络中至少一个为量子长短期记忆网络;

29、上述两个记忆网络中的第一记忆网络用于正向处理上述待识别文本序列,上述两个记忆网络中的第二记忆网络用于反向处理上述待识别文本序列;

30、其中,上述第一记忆网络的输出与上述第二记忆网络的输出进行拼接处理,获得上述待识别文本序列中各元素对应的目标特征信息。

31、第四方面,本技术的一个实施例提供了一种量子计算机操作系统,利用上述任一项上述的基于量子计算的文本识别方法对待识别文本序列的进行处理。

32、第五方面,本技术的一个实施例提供了一种存储介质,上述存储介质中存储有计算机程序,其中,上述计算机程序被设置为运行时执行上述任一项上述的方法。

33、第六方面,本技术的一个实施例提供了一种电子装置,包括存储器和处理器,上述存储器中存储有计算机程序,上述处理器被设置为运行上述计算机程序以执行上述任一项上述的方法。

34、与现有技术相比,本发明在获取到待识别文本序列之后,可以将待识别文本序列输入至预先训练完成的量子文本识别模型,而由于量子文本识别模型包括两个记忆网络,两个记忆网络中的第一记忆网络用于正向处理待识别文本序列,两个记忆网络中的第二记忆网络用于反向处理待识别文本序列,这样,可以更好地发现待识别文本序列中各元素之间的隐藏关联性,而且,两个记忆网络中至少一个为量子长短期记忆网络,则可以提升获得待识别文本序列中各元素对应的目标特征信息的效率以及准确性,从而可以更高效准确地确定待识别文本序列对应的文本识别结果。

35、进一步地,由于量子长短期记忆网络针对长序列文本也有较强的处理能力,因此,本公开的方式在针对长序列文本进行识别时,也可以维持较高的识别效率以及准确率。


技术特征:

1.一种基于量子计算的文本识别方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述第一记忆网络和所述第二记忆网络的类型均为量子长短期记忆网络。

3.根据权利要求1所述的方法,其特征在于,所述第一记忆网络输出所述待识别文本序列中各元素对应的第一特征信息,所述第二记忆网络输出所述待识别文本序列中各元素对应的第二特征信息;

4.根据权利要求1所述的方法,其特征在于,元素的目标特征信息包括用于指示元素为预定义实体的概率信息;

5.根据权利要求4所述的方法,其特征在于,在所述基于各元素对应的目标特征信息,确定各元素是否为预定义实体之前,所述方法还包括:

6.根据权利要求5所述的方法,其特征在于,所述基于各元素在所述待识别文本序列中的顺序,对各元素对应的目标特征信息中的概率信息进行更新,包括:

7.一种量子文本识别模型,其特征在于,量子文本识别模型包括两个记忆网络,所述两个记忆网络中至少一个为量子长短期记忆网络;

8.一种基于量子计算的文本识别装置,其特征在于,所述装置包括:

9.一种量子计算机操作系统,其特征在于,利用权利要求1至6中任一项所述的数据处理方法对待推理数据的进行处理。

10.一种存储介质,其特征在于,所述存储介质中存储有计算机程序,其中,所述计算机程序被设置为运行时执行所述权利要求1至6任一项中所述的方法。

11.一种电子装置,包括存储器和处理器,其特征在于,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机程序以执行所述权利要求1至6任一项中所述的方法。


技术总结
本发明公开了一种量子文本识别模型及基于量子计算的文本识别方法、装置及介质,以解决现有技术中不足。在获取到待识别文本序列之后,可以将待识别文本序列输入至预先训练完成的量子文本识别模型,而由于量子文本识别模型包括两个记忆网络,两个记忆网络中的第一记忆网络用于正向处理待识别文本序列,两个记忆网络中的第二记忆网络用于反向处理待识别文本序列,这样,可以更好地发现待识别文本序列中各元素之间的隐藏关联性,而且,两个记忆网络中至少一个为量子长短期记忆网络,则可以提升获得待识别文本序列中各元素对应的目标特征信息的效率以及准确性,从而可以更高效准确地确定待识别文本序列对应的文本识别结果。

技术研发人员:窦猛汉,请求不公布姓名,请求不公布姓名
受保护的技术使用者:本源量子计算科技(合肥)股份有限公司
技术研发日:
技术公布日:2024/10/31
转载请注明原文地址: https://www.8miu.com/read-26085.html

最新回复(0)