非物质文化遗产知识图谱构建方法、系统及介质

allin2025-05-02  37


本发明涉及知识图谱构建,特别涉及非物质文化遗产知识图谱构建方法、系统及介质。


背景技术:

1、知识图谱是以图形方式呈现知识之间关联关系的技术。2012年,谷歌首次提出知识图谱技术,通过搜索词条向用户展示相关词条或关键字的相互关系,以便于快速发现信息和知识。目前成熟的知识图谱应用有freebase、wikidata等。知识图谱在非遗领域的应用较广泛,以围绕本体和语义关系构建的应用为主。美国国家网络化文化遗产倡导组织专门从事非物质文化的数字建构,如语义信息架构、语义关系、关键字索引呈现、文化内容数字化重构。欧洲数字博物馆较早采用语义网技术,通过分散、异构数字文化资源间的语义关联,将不同机构、不同元数据标准的信息资源进行统一,从知识表示、资源描述、本体构建和数据关系等方面实现非遗资源多维度可视化呈现,成为欧洲重要的文化资源平台。

2、综合国内外研究,利用语义关系建立关联数据,使其成为本体构建的一部分,是知识图谱研究的热点。国内基于知识图谱的研究集中在数字人文语义网、数据关联构建等方面,有关非遗知识图谱构建、搜索及可视化表达的研究不多,缺乏对非遗领域知识服务的深层理解和应用。知识图谱构建是非遗数字资源可视化呈现的重要组成部分,不仅涉及语义知识分析、表述框架设计、知识表示方法,还包括人物关系呈现、知识推理等复杂环节。目前我国非遗数字化资源保护取得一系列进展,也面临以下问题:资源入库信息零散,关联少,非遗资源库缺少统一建设,未实现跨平台、跨系统应用,难以实现多源异构数据的高效检索和可视化呈现。


技术实现思路

1、本发明要解决的技术问题是克服现有技术的缺陷,提供非物质文化遗产知识图谱构建方法、系统及介质。

2、为了解决上述技术问题,本发明提供了如下的技术方案:

3、本发明非物质文化遗产知识图谱构建方法,包括以下步骤:

4、通过预设的获取算法获取非遗文本数据源;

5、对每个所述非遗文本数据源进行实体识别、知识抽取和知识表示,从而提取非遗文本数据源的语义信息、语义关系、语义特征和事件信息;

6、根据对应的所述语义信息、对应的所述语义关系、对应的所述语义特征和对应的所述事件信息构建非遗知识图谱;

7、通过预设的存储模型对所述非遗知识图谱进行存储;

8、通过预设的索引算法对所述非遗知识图谱进行调用。

9、作为本发明的一种优选技术方案,所述实体识别包括以下子步骤:

10、通过深度学习的lstm-crf模型中的嵌入层对每个所述非遗文本数据源进行数据预处理,将所述非遗文本数据源转化为向量输入嵌入层,再经过嵌入层处理得到相应信息的嵌入向量;

11、在双向lstm层,有正负向量层和信息加工ci层,li和ri层分别计算输入对应的向量信息,ci层整合li和ri的信息并进行解码输出;

12、在crf层对输入信息进行序列标注,从而提取非遗的语义信息。

13、作为本发明的一种优选技术方案,所述知识抽取包括以下子步骤:

14、实体抽取,对所述非遗文本数据源中的文本中的实体进行识别和定位,然后再将实体划归到预定义的类别中;

15、关系抽取,抽取两个实体间的语义关系;

16、事件抽取,对所述非遗文本数据源中的文本中的事件信息进行抽取,并以结构化的形式表示。

17、作为本发明的一种优选技术方案,所述知识表示包括以下子步骤:

18、每一个所述事件实例用头实体(h),关系(r),尾实体(t)表达,可将其定义为一个三元组(h,r,t),它们之间关系成立的程度可以通过平移关系来表达;

19、通过transe模型对所述事件实例进行处理,并在transe模型中引入hing loss目标函数。

20、作为本发明的一种优选技术方案,所述关系抽取包括模板关系抽取和监督学习关系抽取。

21、作为本发明的一种优选技术方案,所述事件抽取包括元事件抽取和主题事件抽取。

22、所述通过预设的存储模型对所知识图谱进行存储包括以下子步骤:

23、所述非遗知识图谱通过图数据存储的方式存储在预设的存储框架内;

24、所述预设的存储框架包括模型层和数据层。

25、所述模型层包括模型建模功能和接口管理功能;

26、所述数据层包括rdf模型和属性图模型以及数据操作功能和存储管理功能。

27、与现有技术相比,本方法的有益效果如下:

28、通过知识表示能实现语义特征的高效获取以及运算,从而实现知识挖掘,通过知识抽取能够降低可能存在噪声和误差提升知识获取的精度,通过本方法以实现多源异构数据的高效检索和可视化呈现。

29、本发明非物质文化遗产知识图谱系统,包括数据收集模块、知识构建模块、存储模块、调用模块和处理器,所述数据收集模块、所述知识构建模块、所述存储模块与所述调用模块均与所述处理器通信连接,所述数据收集模块将收集到的数据输入至所述知识构建模块进行实体识别、知识抽取和知识表示,然后将得到的数据构建呈非遗知识图谱输入至所述存储模块内进行存储,所述调用模块对所述存储模块内的非遗知识图谱进行调用并输出。

30、与现有技术相比,本系统的有益效果如下:

31、通过本系统对杂乱的非遗数据进行提取并整理,并对提取整理得到的数据构建非遗知识图谱,提升了非遗知识之间的关联性和易读性,方便用户查看和学习非遗方面的知识。



技术特征:

1.非物质文化遗产知识图谱构建方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的非物质文化遗产知识图谱构建方法,其特征在于,所述实体识别包括以下子步骤:

3.根据权利要求2所述的非物质文化遗产知识图谱构建方法,其特征在于,所述知识抽取包括以下子步骤:

4.根据权利要求3所述的非物质文化遗产知识图谱构建方法,其特征在于,所述知识表示包括以下子步骤:

5.根据权利要求3所述的非物质文化遗产知识图谱构建方法,其特征在于,所述关系抽取包括模板关系抽取和监督学习关系抽取。

6.根据权利要求3所述的非物质文化遗产知识图谱构建方法,其特征在于,所述事件抽取包括元事件抽取和主题事件抽取。

7.根据权利要求1所述的非物质文化遗产知识图谱构建方法,其特征在于,所述通过预设的存储模型对所知识图谱进行存储包括以下子步骤:

8.根据权利要求7所述的非物质文化遗产知识图谱构建方法,其特征在于,所述模型层包括模型建模功能和接口管理功能;

9.非物质文化遗产知识图谱系统,其特征在于,包括数据收集模块(1)、知识构建模块(2)、存储模块(3)、调用模块(4)和处理器(5),所述数据收集模块(1)、所述知识构建模块(2)、所述存储模块(3)与所述调用模块(4)均与所述处理器(5)通信连接,所述数据收集模块(1)将收集到的数据输入至所述知识构建模块(2)进行实体识别、知识抽取和知识表示,然后将得到的数据构建呈非遗知识图谱输入至所述存储模块(3)内进行存储,所述调用模块(4)对所述存储模块(3)内的非遗知识图谱进行调用并输出。

10.一种存储介质,其上存储有计算机指令,其特征在于,所述计算机指令运行时执行权利要求1至8任一项所述方法的步骤。


技术总结
本发明公开了非物质文化遗产知识图谱构建方法、系统及介质,本发明是非物质文化遗产知识图谱构建方法,通过知识表示能实现语义特征的高效获取以及运算,从而实现知识挖掘,通过知识抽取能够降低可能存在噪声和误差提升知识获取的精度,通过本方法以实现多源异构数据的高效检索和可视化呈现,非物质文化遗产知识图谱系统,通过本系统对杂乱的非遗数据进行提取并整理,并对提取整理得到的数据构建非遗知识图谱,提升了非遗知识之间的关联性和易读性,方便用户查看和学习非遗方面的知识。

技术研发人员:范青
受保护的技术使用者:荆楚理工学院
技术研发日:
技术公布日:2024/10/31
转载请注明原文地址: https://www.8miu.com/read-20869.html

最新回复(0)