本发明涉及计算机,尤其涉及一种智能会议记录方法、装置和电子设备。
背景技术:
1、铁路会议在铁路行业中扮演着至关重要的角色,这些会议是信息交流和决策制定的平台,也是推动铁路行业发展和技术创新的重要途径。会议记录作为会议内容、决议事项及工作部署等核心信息的实时记载,是形成会议正式文件的重要依据与基础材料。会议记录不仅详实反映了会议的全过程和讨论成果,而且对会后的工作执行、任务分配以及责任落实起到了关键性的指导作用。因此,严谨、准确、全面地做好会议记录工作,对于确保会议精神的有效传达、各项工作任务的顺利推进以及组织目标的成功实现具有不可忽视的意义。同时,会议记录也是评估会议效率、回顾总结工作经验、持续改进工作方法的重要参考依据。
2、随着铁路行业的快速发展,各类会议活动如工作部署会、专家评审会、安全生产会、专项办公会及汇报演讲会等数量急剧增长,这无疑产生了海量的会议内容记录、整理与共享需求。现有技术中采用通用人工智能模型对铁路会议进行识别并进行语音分离,但通用人工智能模型对铁路领域专业术语的识别不够准确,语音分离效果较差,导致会议记录中存在铁路领域专业术语错误和发言者标注错误,且错误率较高。
技术实现思路
1、本发明提供一种智能会议记录方法、装置和电子设备,用以解决现有技术中通过通用人工智能模型生成的会议记录中存在铁路领域专业术语错误和发言者标注错误,且错误率较高的缺陷,实现会议记录正确率的提高。
2、本发明提供一种智能会议记录方法,包括如下步骤:
3、获取铁路会议过程中的目标音频;
4、将所述目标音频输入语音识别模型,得到所述语音识别模型输出的文本结果,所述语音识别模型是通过铁路语料库中的语音数据集训练获得的;
5、将所述目标音频输入声纹识别模型,得到所述声纹识别模型输出的发言者标识,所述声纹识别模型是通过所述铁路语料库中的声纹数据集训练获得的;
6、基于所述文本结果和所述发言者标识确定会议记录。
7、根据本发明提供的一种智能会议记录方法,所述将所述目标音频输入语音识别模型,得到所述语音识别模型输出的文本结果,包括:
8、将所述目标音频输入所述语音识别模型,所述语音识别模型用于对所述目标音频进行预处理,得到预处理后的第一音频;对所述第一音频进行编码,得到第二音频;确定第二音频对应的多个第一文本;将铁路热词库分别与各所述第一文本进行匹配,确定各所述第一文本分别对应的第二文本;确定各所述第二文本的分数,将所述分数最高的第二文本确定为所述文本结果;
9、获取所述语音识别模型输出的所述文本结果。
10、根据本发明提供的一种智能会议记录方法,所述将所述目标音频输入声纹识别模型,得到所述声纹识别模型输出的发言者标识,包括:
11、将所述目标音频输入所述声纹识别模型,所述声纹识别模型用于对所述目标音频进行降噪处理,得到降噪处理后的第二音频;计算所述第二音频的声纹嵌入码,并确定所述声纹嵌入码分别与各预设声纹嵌入码模板的相似度分数;分别对各所述相似度分数进行归一化处理,得到各目标相似度分数;基于最大的目标相似度分数对应的预设声纹嵌入码模板确定所述发言者标识;
12、获取所述声纹识别模型输出的所述发言者标识。
13、根据本发明提供的一种智能会议记录方法,所述基于所述文本结果和所述发言者标识确定会议记录,包括:
14、将所述文本结果和所述发言者标识输入大语言模型进行纠错,确定所述文本结果和所述发言者标识对应的目标文本;所述大语言模型是通过铁路语料库中的文本数据集训练获得的;
15、基于所述目标文本确定所述会议记录。
16、根据本发明提供的一种智能会议记录方法,所述方法还包括:
17、将所述会议记录和预设纪要模版输入所述大语言模型,得到所述会议记录对应的会议纪要。
18、根据本发明提供的一种智能会议记录方法,所述获取铁路会议过程中的目标音频,包括:
19、接收阵列麦克风采集的所述铁路会议过程中的目标音频。
20、本发明还提供一种智能会议记录装置,包括如下模块:
21、获取模块,用于获取铁路会议过程中的目标音频;
22、文本模块,用于将所述目标音频输入语音识别模型,得到所述语音识别模型输出的文本结果,所述语音识别模型是通过铁路语料库中的语音数据集训练获得的;
23、标识模块,用于将所述目标音频输入声纹识别模型,得到所述声纹识别模型输出的发言者标识,所述声纹识别模型是通过所述铁路语料库中的声纹数据集训练获得的;
24、确定模块,用于基于所述文本结果和所述发言者标识确定会议记录。
25、本发明还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述任一种所述智能会议记录方法。
26、本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述智能会议记录方法。
27、本发明还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述任一种所述智能会议记录方法。
28、本发明提供的一种智能会议记录方法、装置和电子设备,获取铁路会议过程中的目标音频,将目标音频输入语音识别模型,得到语音识别模型输出的文本结果;还将目标音频输入声纹识别模型,得到声纹识别模型输出的发言者标识。进一步基于文本结果和发言者标识确定会议记录。本发明技术方案中语音识别模型是通过铁路语料库中的语音数据集训练获得的,声纹识别模型是通过铁路语料库中的声纹数据集训练获得的,因此,语音识别模型和声纹识别模型相比通用人工智能模型具有更强的专业性和准确性,通过本发明模型确定的文本结果和发言者标识更加精确,进而提高了会议记录的正确率。
1.一种智能会议记录方法,其特征在于,包括:
2.根据权利要求1所述的智能会议记录方法,其特征在于,所述将所述目标音频输入语音识别模型,得到所述语音识别模型输出的文本结果,包括:
3.根据权利要求1所述的智能会议记录方法,其特征在于,所述将所述目标音频输入声纹识别模型,得到所述声纹识别模型输出的发言者标识,包括:
4.根据权利要求1所述的智能会议记录方法,其特征在于,所述基于所述文本结果和所述发言者标识确定会议记录,包括:
5.根据权利要求4所述的智能会议记录方法,其特征在于,所述方法还包括:
6.根据权利要求1至5任一项所述的智能会议记录方法,其特征在于,所述获取铁路会议过程中的目标音频,包括:
7.一种智能会议记录装置,其特征在于,包括:
8.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至6任一项所述智能会议记录方法。
9.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6任一项所述智能会议记录方法。
10.一种计算机程序产品,包括计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6任一项所述智能会议记录方法。