本发明涉及数据处理,尤其是涉及一种基于元数据实现机器可读标准语义化表示的数据处理方法。
背景技术:
1、伴随数字化时代的到来,数字经济已经成为全球未来发展方向。标准数字化指利用数字技术对标准本身及生命周期全过程赋能,使标准承载的规则与特性能够通过数字设备进行读取、传输与使用的过程。
2、数字技术的赋能为标准在机器中应用和交互提供了可能。未来的标准将分为:人员使用的标准、机器使用的标准、人机协作的标准等类型。然而,人员和机器对标准内容的解析方式存在明显不同,人类在理解非结构化数据和逻辑推断方面通常比机器更好,能够从更丰富的经验中获得知识,因此可以关联外部参考。机器通常无法理解非结构化的数据,也不能对未显式定义的外部上下文进行推断,通常不容忍语法和语义错误,因此内容的数据准确性对于机器而言尤为重要,因此,机器对标准的语义互操作性提出了很高的要求,无论从标准技术内容的编写上,还是从标准交付的呈现形式上,都需要根据机器的解析需求进行创建。
3、机器可读标准可理解为技术内容可直接由机器、软件或自动化系统解析和使用,以用户/应用特定的、可移植的数字化形式提供的新型标准。机器可读标准作为实现标准数字化转型发展的重要抓手,已成为当前国内外标准化组织研究的重点。
4、在电力领域,当前标准还多以纸质文本或电子版pdf格式发布,尚未能实现标准以数据形态进行编撰使用。电网企业跨部门、跨专业、跨领域的技术融合和创新协同要求逐步提高,传统的标准形式已不能满足标准研制、实施等工作的需要。
5、综上,当前缺少一种能够实现机器可读标准的语义表示的方法,以辅助实现异构系统和机器间的互联、互通、互操作。
技术实现思路
1、本发明的目的就是为了克服上述现有技术存在的缺陷而提供一种基于元数据实现机器可读标准语义化表示的数据处理方法,以解决或部分解决电力产业中难以实现机器可读标准的语义表示的问题。
2、本发明的目的可以通过以下技术方案来实现:
3、本发明的一个方面,提供了一种基于元数据实现机器可读标准语义化表示的数据处理方法,包括如下步骤:
4、基于预先选定的描述语言和标准标签集,通过识别标准的各个层次,获取机器可读的结构化标准文档;
5、基于所述结构化标准文档构建电力系统数据字典,所述数据字典包括电力系统中对象的属性信息;
6、基于所述电力系统数据字典,以元数据方法构建语义网络的模式层和数据层,实现电力系统数据的语义关联。
7、作为优选的技术方案,基于预先确定的描述语言和标准标签集,获取机器可读的结构化标准文档的过程包括如下步骤:
8、基于标准标签集,利用预先选定的描述语言识别标准的各个层次,通过对标准内容进行重构实现标准内容的结构化。
9、作为优选的技术方案,所述的基于所述结构化标准文档构建电力系统数据字典的过程包括如下步骤:
10、针对所述结构化标准文档中的技术数据构建具有编码、名称、定义以及上下级从属关系的属性列表,提取用于描述对象的必要信息的分类和属性,形成描述不同技术内容的属性集合,实现基于标准对象技术本体的电力系统数据字典的构建。
11、作为优选的技术方案,基于所述电力系统数据字典,以元数据方法构建语义网络的模式层和数据层的过程包括如下步骤:
12、基于所述电力系统数据字典,获取网络本体语言形式的用于约束数据且可共享的本体规则,形成知识概念模板,实现所述模式层的构建;
13、基于资源描述框架实现所述数据层的构建。
14、作为优选的技术方案,所述的数据层用于针对所述模式层中知识概念模版进行具象化处理。
15、作为优选的技术方案,所述的数据处理方法还包括如下步骤:
16、利用所述语义网络连接多源异构数据,实现系统间的语义互操作。
17、作为优选的技术方案,所述的描述语言包括html、xml和json。
18、作为优选的技术方案,所述的标准的各个层次包括前言、主题、附录和技术要素,所述技术要素包括标准章节条、段落、列项、图、表、公式和注释。
19、本发明的另一个方面,提供了一种电子设备,包括:一个或多个处理器以及存储器,所述存储器内储存有一个或多个程序,所述一个或多个程序包括用于执行前述基于元数据实现机器可读标准语义化表示的数据处理方法的指令。
20、本发明的另一个方面,提供了一种计算机可读存储介质,包括供电子设备的一个或多个处理器执行的一个或多个程序,所述一个或多个程序包括用于执行前述基于元数据实现机器可读标准语义化表示的数据处理方法的指令。
21、与现有技术相比,本发明至少具有以下有益效果之一:
22、(1)实现机器可读标准的语义表示:针对传统的标准形式数字化程度低,难以实现机器可读标准语义化表示的问题,本发明首先利用描述语言和标准标签集识别标准的各个层次以构建机器可读的结构化标准文档,然后构建表征对象属性的电力系统数据字典,最后构建包括模式层和数据层的语义网络实现语义表示。
23、(2)应用前景广泛:本发明通过将机器可读标准进行语义表示,能够利用构建语义网络连接多源异构数据,实现系统间的语义互操作,在标准的检索、查询等场景有广泛应用前景。
24、(3)克服交互瓶颈的问题:针对技术标准内容多模态异构等复杂特性导致的交互瓶颈问题,通过构建包括模式层和数据层的语义网络,实现基于标准对象技术本体的电力系统数据字典的构建,为异构系统和机器间的互联、互通、互操作做好准备。
25、(4)扩展方便且灵活:本发明采用基于元数据的方法来构建的语义网,通过本体论方法能够丰富且详实地描述传感器信息,对于模式层,本体语言能够构建复杂本体关系的能力,对于实体层,资源描述框架能够实现以逻辑形式来表示实体的语义信息,采用元数据语言描述从而拓展更加灵活,具有人机可读,可由机器自动处理的优点。
1.一种基于元数据实现机器可读标准语义化表示的数据处理方法,其特征在于,包括如下步骤:
2.根据权利要求1所述的一种基于元数据实现机器可读标准语义化表示的数据处理方法,其特征在于,基于预先确定的描述语言和标准标签集,获取机器可读的结构化标准文档的过程包括如下步骤:
3.根据权利要求1所述的一种基于元数据实现机器可读标准语义化表示的数据处理方法,其特征在于,所述的基于所述结构化标准文档构建电力系统数据字典的过程包括如下步骤:
4.根据权利要求1所述的一种基于元数据实现机器可读标准语义化表示的数据处理方法,其特征在于,基于所述电力系统数据字典,以元数据方法构建语义网络的模式层和数据层的过程包括如下步骤:
5.根据权利要求4所述的一种基于元数据实现机器可读标准语义化表示的数据处理方法,其特征在于,所述的数据层用于针对所述模式层中知识概念模版进行具象化处理。
6.根据权利要求1所述的一种基于元数据实现机器可读标准语义化表示的数据处理方法,其特征在于,所述的数据处理方法还包括如下步骤:
7.根据权利要求1所述的一种基于元数据实现机器可读标准语义化表示的数据处理方法,其特征在于,所述的描述语言包括html、xml和json。
8.根据权利要求1所述的一种基于元数据实现机器可读标准语义化表示的数据处理方法,其特征在于,所述的标准的各个层次包括前言、主题、附录和技术要素,所述技术要素包括标准章节条、段落、列项、图、表、公式和注释。
9.一种电子设备,其特征在于,包括:一个或多个处理器以及存储器,所述存储器内储存有一个或多个程序,所述一个或多个程序包括用于执行如权利要求1-8任一所述基于元数据实现机器可读标准语义化表示的数据处理方法的指令。
10.一种计算机可读存储介质,其特征在于,包括供电子设备的一个或多个处理器执行的一个或多个程序,所述一个或多个程序包括用于执行如权利要求1-8任一所述基于元数据实现机器可读标准语义化表示的数据处理方法的指令。