本发明属于基于大模型语言的长文报告生成,涉及一种基于大语言模型的长文报告智能创作方法及系统。
背景技术:
1、在当前信息化和数字化时代,企业级长文报告的创作与分析显得尤为重要,不仅关系到企业信息的准确传达,也影响着决策制定的效率和质量。然而,传统企业长文报告的创作往往面临时间消耗大、效率低下、人力成本高等问题。同时,对于分析工作来说,人工进行大量数据的处理与分析不仅耗时耗力,而且容易出错,且难以保证结果的客观性和一致性。
2、为了解决上述问题,大语言模型的应用逐渐进入研究者视野。大语言模型能够利用人工智能和机器学习技术,通过分析海量的文本数据,自动化的提取、归纳信息,生成符合特定风格和要求的文本内容。这样的技术不仅提高了文档创作的效率,而且保证了内容的准确性和一致性。
3、然而,尽管当前的技术可以基于大语言模型在分析企业级长文报告方面能够处理较长且复杂的内容,但依然存在一定局限性。例如,报告生成的长度限制、生成内容的深度与细节控制等问题。因此,对于需要大量内容和深入分析的企业长文报告生成,现有技术往往无法完全满足需求。
技术实现思路
1、本发明提供了一种基于大语言模型的长文报告智能创作方法及系统,解决现有的长文报告生成过程产出字数存在局限性以及内容匹配的精准性低的技术问题。
2、本发明采用以下技术方案:
3、本发明提供了一种基于大语言模型的长文报告智能创作方法,包括:
4、s1:提取输入数据的关键信息,根据关键信息划分不同子任务场景,并进行存储;
5、s2:获取不同子任务场景的任务描述和相应模板,基于相应模板和任务要求获取相关信息,判断每次获取相关信息的字数是否超过字数阈值,如果未超过字数阈值,则直接获取相关信息;如果超过字数阈值,则将子任务场景重新拆成多个分级子任务场景,并依次获取拆解后的分级子任务场景对应的相关信息;
6、s3:对相关信息进行prompt工程处理,并生成子任务队列;
7、s4:依次执行子任务队列,产出长文报告。
8、可选地,s1:提取输入数据的关键信息,根据关键信息划分不同子任务场景,并进行存储包括:
9、对输入数据进行数据类型分析,根据数据类型确定对应解析方式,并解析出输入数据的关键信息;
10、根据关键信息生成不同任务画像,根据任务画像划分出多个不同子任务场景;
11、对不同子任务场景进行信息归类,打上对应子任务场景的标签并进行存储。
12、可选地,s2:获取不同子任务场景的任务描述和相应模板,基于相应模板和任务要求获取相关信息,判断每次获取相关信息的字数是否超过字数阈值,如果未超过字数阈值,则直接获取相关信息;如果超过字数阈值,则将子任务场景重新拆成多个分级子任务场景,并依次获取拆解后的分级子任务场景对应的相关信息,包括:
13、根据客户需求确定子任务场景,根据子任务场景匹配合适的模板;
14、基于模板,获取任务描述,并根据任务描述进行信息编排,获取相关信息。
15、可选地,根据任务描述进行信息编排,获取相关信息,包括:
16、根据任务要求,判断每次获取相关信息的字数是否超过字数阈值,如果未超过字数阈值,则直接获取相关信息;如果超过字数阈值,则将子任务场景重新拆成多个分级子任务场景,并依次获取拆解后的分级子任务场景对应的相关信息。
17、可选地,s3:对相关信息进行prompt工程处理,并生成子任务队列包括:
18、采用transformer的decoder机制,通过模型对长上下文的理解能力,将已生成的信息结合进prompt实现任务拆解,生成子任务队列。
19、可选地,s4:依次执行子任务队列,产出长文报告包括:
20、依次执行子任务队列,对每个子任务队列的内容进行任务评估,得到评估结果;
21、根据评估结果进行任务完善,最终产出长文报告。
22、可选地,该方法还包括:用户反馈,响应于客户反馈的内容进行改写、续写、简写、扩写、替换和标注意见操作。
23、本发明还提供了一种基于大语言模型的长文报告智能创作系统,包括:
24、数据分析模块,用于提取输入数据的关键信息,根据关键信息划分不同子任务场景,并进行存储;
25、信息编排模块,用于获取不同子任务场景的任务描述和相应模板,基于相应模板和任务要求获取相关信息,判断每次获取相关信息的字数是否超过字数阈值,如果未超过字数阈值,则直接获取相关信息;如果超过字数阈值,则将子任务场景重新拆成多个分级子任务场景,并依次获取拆解后的分级子任务场景对应的相关信息;
26、prompt工程模块,用于对相关信息进行prompt工程处理,并生成子任务队列;
27、输出模块,用于依次执行子任务队列,产出长文报告。
28、本发明提供了一种计算机设备,包括存储器、处理器以及存储在存储器中并可在处理器上运行的计算机程序,处理器执行计算机程序时实现如上述方法实施例中任一项一种基于大语言模型的长文报告智能创作方法。
29、本发明提供了一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,计算机程序被处理器执行时实现上述方法实施例中任一项一种基于大语言模型的长文报告智能创作方法。
30、本发明的有益效果是:
31、本发明提出了一种基于大语言模型的长文报告智能创作方法及系统。该系统可以对用户输入的资料进行解析,并划分不同的任务场景;根据客户的要求对输入的数据匹配合适的模板,并根据该模板下的任务场景的描述,抓取对应的内容;在抓取过程中,根据抓取内容的字数限制,如果超过抓取数字阈值,则将该任务划分为多个子任务,进一步分级提取对应的信息,从而达到满足对文档的细节和深度的把控;此外通过字数阈值限制,可以实现不同文章段落字数的要求,从而保证,输出的内容符合一定的客户要求。此外,在本发明提供的基于大语言模型的长文报告智能创作系统在内容编排过程中增加了用户反馈模块,可以对产出的长文报告进行溯源、智能润色、需求追踪等功能,大幅提高了报告创作和分析的效率并降低了人力成本。本发明还具有自动化分析与数据处理的功能,企业级长文报告往往包含大量数据和信息,需要深度分析才能提取有价值的洞察。
1.一种基于大语言模型的长文报告智能创作方法,其特征在于,包括:
2.如权利要求1所述的一种基于大语言模型的长文报告智能创作方法,其特征在于,s1:提取输入数据的关键信息,根据所述关键信息划分不同子任务场景,并进行存储中,包括:
3.如权利要求1所述的一种基于大语言模型的长文报告智能创作方法,其特征在于,s2:获取不同所述子任务场景的任务描述和相应模板,基于所述相应模板和任务要求获取相关信息,判断每次获取相关信息的字数是否超过字数阈值,如果未超过字数阈值,则直接获取所述相关信息;如果超过字数阈值,则将所述子任务场景重新拆成多个分级子任务场景,并依次获取拆解后的分级子任务场景对应的相关信息,包括:
4.如权利要求3所述的一种基于大语言模型的长文报告智能创作方法,其特征在于,根据所述任务描述进行信息编排,获取相关信息,包括:
5.如权利要求1所述的一种基于大语言模型的长文报告智能创作方法,其特征在于,s3:对所述相关信息进行prompt工程处理,并生成子任务队列,包括:采用transformer的decoder机制,通过模型对所述相关信息进行信息划分并合进prompt实现任务拆解,生成子任务队列。
6.如权利要求1所述的一种基于大语言模型的长文报告智能创作方法,其特征在于,s4:依次执行所述子任务队列,产出长文报告,包括:
7.如权利要求1所述的一种基于大语言模型的长文报告智能创作方法,其特征在于,所述方法还包括:用户反馈,响应于客户反馈的内容进行改写、续写、简写、扩写、替换或标注意见操作。
8.一种基于大语言模型的长文报告智能创作系统,其特征在于,包括:
9.一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至7任一项所述一种基于大语言模型的长文报告智能创作方法。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述一种基于大语言模型的长文报告智能创作方法。