1.本发明涉及联邦学习技术领域,具体涉及一种基于多用户加密的联邦学习可视化系统与方法。
背景技术:2.在大多数行业中,由于行业竞争、隐私安全、行政手续复杂等问题,数据常常是以孤岛的形式存在的,甚至即使是在同一个公司的不同部门之间实现数据集中整合也面临着重重阻力,在现实中想要将分散在各地、各个机构的数据进行整合几乎是不可能的,或者说所需的成本是巨大的。随着人工智能的进一步发展,重视数据隐私和安全已经成为了世界性的趋势。联邦机器学习是一个机器学习框架,可以在保护数据隐私、满足合法合规要求的前提下进行机器学习,能有效帮助多个机构在满足用户隐私保护、数据安全和政府法规的要求下,进行数据使用和机器学习建模。
3.现在已经开发出了很多联邦学习系统,经过我们大量的检索与参考,发现现有技术的系统有如公开号为cn112862112a、cn111507481a、us20200364608a1、cn107316280b和cn114266293a所公开的系统,这些系统一般包括:多个计算节点,各计算节点通过网络通信且存储有联邦学习配置文件,各计算节点经过至少一次迭代训练过程联合训练联邦学习模型,直至迭代终止条件到达时,得到已联合训练完成的联邦学习模型。但这些系统在选择用于训练的数据时由系统自主进行选择,且选择的数据适用性参差不齐,用户无法直观地了解到这些数据的适用性。
技术实现要素:4.本发明的目的在于,针对上述联邦学习系统存在的不足,提出了一种基于多用户加密的联邦学习可视化系统与方法。
5.本发明采用如下技术方案:一种基于多用户加密的联邦学习可视化系统,包括本地终端和服务中心,所述本地终端包括加密模块、标签模块、传输模块、操作模块、训练模块和显示模块,所述服务中心包括认证模块、特征模块、存储模块和对齐模块,所述加密模块用于对本地数据进行加密处理,所述标签模块用于给加密数据添加用户标签,所述传输模块用于在本地终端与服务模块间进行数据传输,所述操作模块用于查询、下载所述服务中心的数据资源、所述训练模块用于根据下载的数据资源对模型进行训练,所述显示模块用于显示建模过程以及模型的对比情况,所述认证模块用于对接收的加密数据的用户标签进行可信认证,所述特征模块用于对接收的加密数据进行特征计算并赋予特征标签,所述存储模块将所述加密数据以资源包的形式进行存储,所述对齐模块用于计算两个资源包之间的对齐结果;所述特征模块内设置有多个特征计算单元,每个特征计算单元对应一个特征标签,每个特征标签具有多个子属类别,所述子属类别为对应的特征计算单元选择输入的数据类别,所述对齐模块根据下式计算出最终对齐值p2,p2越大代表两个资源包之间的对齐
结果越好,此时,用户可根据该对齐值p2决定是否下载资源包:;其中,为资源包a拥有的特征标签数量,为资源包b拥有的特征标签数量,为资源包a与资源包b共有的特征标签数量,为资源包a拥有的所有子属类别数量,为资源包b拥有的所有子属类别数量,为资源包a与资源包b共有的子属类别数量,at表示资源包a的特征标签集合,bt表示资源包b的特征标签集合,ai表示资源包a的第i个特征标签,bj表示资源包b的第j个特征标签,表示特征标签具有的子属类别集合,表示特征标签bj具有的子属类别集合,为子属类别重合函数,用于表示两个不同的特征标签的子属类别重合度;其中,;其中,n()表示集合的元素个数;用户通过在所述操作模块中选择资源包计算对齐结果,并根据对齐结果选择下载资源包用于所述训练模块,所述显示模块能够以拖拉拽算法因子组件的形式方便用户建模、显示建模过程、模型训练过程中的参数变化情况及模型运行对比情况,用户在所述显示模块中选择任意时间点生成具有对应参数值的模型,所述显示模块中的模型在运行后显示运行结果,所述显示模块能够显示多个模型运行结果的对比情况,用户在所述显示模块中能够导出模型并生成可移植程序;进一步的,所述操作模块包含三个互动区域,第一互动区域用于显示本地用户上传的资源包,第二互动区域用于显示所述服务中心的所有特征标签,所述第二互动区域中的特征标签具有选中状态或未选中状态,所述第三互动区域用于显示含有选中状态特征标签的所有资源包;进一步的,用户能够在所述操作模块中下载需要的资源包,并将第一互动区域中的资源包和第三互动区域中已下载的资源包拖拽至所述训练模块中,启动所述训练模块后,所述训练模块根据含有的资源包进行模型训练;进一步的,所述特征计算单元从接收的数据中选择对应的数据作为输入数据,所述输入数据经所述特征计算单元计算处理后得到一个输出值,当所述输出值处于设定范围内时,赋予该数据对应的特征标签,一份数据能够同时具有多个特征标签;进一步的,所述显示模块中还包括评价单元,所述评价单元根据每个模型的参数变化情况计算出对应模型的评价指标q,所述评价指标在所述显示模块中显示;所述评价指标q的取值越大,表示模型的效果越好,所述评价指标q的计算公式为:
;其中,n表示模型的参数数量,表示第k个模型参数的评估值;的计算公式为:;其中,为第k个模型参数的最近变化的m个取值的标准差,为第k个模型参数的最近变化的m个取值的平均数,为第k个模型参数的最近变化的2m个取值的标准差,为第k个模型参数的最近变化的2m个取值的平均数,m的具体取值由用户自行设定;所述模型参数的评估值用于表示参数的收敛性和稳定性的综合情况;用于所述的基于多用户加密的联邦学习可视化系统的一种基于多用户加密的联邦学习可视化系统方法,包括如下步骤:s1、所述本地终端将本地的原始数据进行加密处理;s2、所述本地终端将加密数据赋予用户标签;s3、所述本地终端进行本地模型训练,将加密训练梯度数据上传至服务中心;s4、所述服务中心对接收到的加密训练梯度数据进行可信身份认证;s5、所述服务中心对通过认证的加密训练梯度数据进行特征计算,得到特征标签;s6、所述服务中心生成资源包并根据所述特征标签分类保存;s7、用户通过所述本地终端下载所述服务中心上的资源包;s8、用户将下载的资源包用于模型迭代训练;s9、所述本地终端显示建模过程、模型训练过程中的参数变化情况及模型运行对比情况,用户选择任意时间点获取对应的模型;s10、用户输入待执行数据,模型调用待执行数据后自动运行并显示运行结果;s11、用户根据多个模型的运行结果对比情况选择合适的模型导出成可移植程序。
6.本发明所取得的有益效果是:本系统首先实现了通过拖拉拽组件的形式直接而高选择自由的智能建模,并且本系统的高选择自由度体现在两个方面,一是训练数据的处理过程,二是对模型的选择与训练过程。本系统通过对所有用户上传的数据进行计算并添加特征标签,并根据特征标签计算出任意两个资源包的对齐结果,用户通过对齐结果更好地选择训练需要的资源包。本系统通过显示模块来实现数据的处理与模型的选择和训练,显示模块能够以拖拉拽算法因子组件的形式方便用户建模、显示建模过程、模型训练过程中的参数变化情况及模型运行对比情况,用户能够选择任意时间生成对应的模型,在输入待执行数据后,显示模块能够显示所有模型的运行结果,用户根据运行结果的对比情况选择最合适的模型导出为可移植程序。
7.为使能更进一步了解本发明的特征及技术内容,请参阅以下有关本发明的详细说明与附图,然而所提供的附图仅用于提供参考与说明,并非用来对本发明加以限制。
附图说明
8.图1为本发明整体结构框架示意图;图2为本发明操作模块构成及呈现内容示意图;图3为本发明建模可视化流程及显示示意图;图4为本发明通过可视化方式选择模型的流程示意图;图5为本发明特征模块赋予特征标签示意图。
具体实施方式
9.以下是通过特定的具体实施例来说明本发明的实施方式,本领域技术人员可由本说明书所公开的内容了解本发明的优点与效果。本发明可通过其他不同的具体实施例加以施行或应用,本说明书中的各项细节也可基于不同观点与应用,在不背离本发明的精神下进行各种修饰与变更。另外,本发明的附图仅为简单示意说明,并非依实际尺寸描绘,事先声明。以下实施方式将进一步详细说明本发明的相关技术内容,但所公开的内容并非用以限制本发明的保护范围。
10.实施例一。
11.本实施例提供了一种基于多用户加密的联邦学习可视化系统,结合图1,包括本地终端和服务中心,所述本地终端包括加密模块、标签模块、传输模块、操作模块、训练模块和显示模块,所述服务中心包括认证模块、特征模块、存储模块和对齐模块,所述加密模块用于对本地数据进行加密处理,所述标签模块用于给加密数据添加用户标签,所述传输模块用于在本地终端与服务模块间进行数据传输,所述操作模块用于查询、下载所述服务中心的数据资源、所述训练模块用于根据下载的数据资源对模型进行训练,所述显示模块用于显示建模过程、模型参数变化、以及模型的对比情况,所述认证模块用于对接收的加密数据的用户标签进行可信认证,所述特征模块用于对接收的加密数据进行特征计算并赋予特征标签,所述存储模块将所述加密数据以资源包的形式进行存储,所述对齐模块用于计算两个资源包之间的对齐结果;所述特征模块内设置有多个特征计算单元,每个特征计算单元对应一个特征标签,每个特征标签具有多个子属类别,所述子属类别为对应的特征计算单元选择输入的数据类别,所述对齐模块根据下式计算出最终对齐值p2,p2越大代表两个资源包之间的对齐结果越好,此时,用户可根据该对齐值p2决定是否下载资源包:;其中,为资源包a拥有的特征标签数量,为资源包b拥有的特征标签数量,为资源包a与资源包b共有的特征标签数量,为资源包a拥有的所有子属类别数量,为资源包b拥有的所有子属类别数量,为资源包a与资源包b共有的子属类别数量,at表示资源包a的特征标签集合,bt表示资源包b的特征标签集合,ai表示资源包a的第i个特征
标签,bj表示资源包b的第j个特征标签,表示特征标签具有的子属类别集合,表示特征标签bj具有的子属类别集合,为子属类别重合函数,用于表示两个不同的特征标签的子属类别重合度;其中,;其中,n()表示集合的元素个数;用户通过在所述操作模块中选择资源包计算对齐结果,并根据对齐结果选择下载资源包用于所述训练模块,所述显示模块能够以拖拉拽算法因子组件的形式方便用户建模、显示建模过程、模型训练过程中的参数变化情况及模型运行对比情况,用户在所述显示模块中选择任意时间点生成具有对应参数值的模型,所述显示模块中的模型在运行后显示运行结果,所述显示模块能够显示多个模型运行结果的对比情况,用户在所述显示模块中能够导出模型并生成可移植程序;所述操作模块包含三个互动区域,第一互动区域用于显示本地用户上传的资源包,第二互动区域用于显示所述服务中心的所有特征标签,所述第二互动区域中的特征标签具有选中状态或未选中状态,所述第三互动区域用于显示含有选中状态的特征标签的所有资源包;用户能够在所述操作模块中下载需要的资源包,并将第一互动区域中的资源包和第三互动区域中已下载的资源包拖拽至所述训练模块中,启动所述训练模块后,所述训练模块根据含有的资源包进行模型训练;所述特征计算单元从接收的数据中选择对应的数据作为输入,所述输入经所述特征计算单元计算处理后得到一个输出值,当所述输出值处于设定范围内时,赋予该数据对应的特征标签,一份数据能够同时具有多个特征标签;所述显示模块中还包括评价单元,所述评价单元根据每个模型的参数变化情况计算出对应模型的评价指标q,所述评价指标在所述显示模块中显示;所述评价指标q的取值越大,表示模型的效果越好,所述评价指标q的计算公式为:;其中,n表示模型的参数数量,表示第k个模型参数的评估值;的计算公式为:;其中,为第k个模型参数的近m个取值的标准差,为第k个模型参数的近m个取值的平均数,为第k个模型参数的近2m个取值的标准差,为第k个模型参数的近2m个取值的平均数,m的具体取值由用户自行设定;所述模型参数的评估值用于表示参数的收敛性和稳定性的综合情况;
本实施例中,还结合所述联邦学习可视化系统提供其工作方法,即基于多用户加密的联邦学习可视化系统方法,包括如下步骤:s1、所述本地终端将本地的原始数据进行加密处理;s2、所述本地终端将加密数据赋予用户标签;s3、所述本地终端进行本地模型训练,将加密训练梯度数据上传至服务中心;s4、所述服务中心对接收到的加密训练梯度数据进行可信身份认证;s5、所述服务中心对通过认证的加密训练梯度数据进行特征计算,得到特征标签;s6、所述服务中心生成资源包并根据所述特征标签分类保存;s7、用户通过所述本地终端下载所述服务中心上的资源包;s8、用户将下载的资源包用于模型迭代训练;s9、所述本地终端显示建模过程、模型训练过程中的参数变化情况及模型运行对比情况,用户选择任意时间点获取对应的模型;s10、用户输入待执行数据,模型调用待执行数据后自动运行并显示运行结果;s11、用户根据多个模型的运行结果对比情况选择合适的模型并导出成可移植程序。
12.实施例二。
13.本实施例包含了实施例一的全部内容,提供了一种基于多用户加密的联邦学习可视化系统,包括本地终端和服务中心,所述本地终端用于完成模型的建立、训练以及结果的显示,所述服务中心用于接收各个本地终端发送的数据并对数据预处理后进行保存;所述本地终端包括加密模块、标签模块和传输模块,所述加密模块用于对本地原始数据进行加密,所述标签模块用于对加密数据赋予用户标签,所述加密数据通过所述传输模块上传至所述服务中心;所述服务中心包括认证模块、特征模块和存储模块,所述认证模块用于对接收的数据进行用户标签的可信身份认证,当通过认证后,所述认证模块将接收的数据发送至所述特征模块,所述特征模块对接收的数据进行特征计算,并将计算得到的特征标签赋予给接收的数据,所述存储模块用于保存含有特征标签的数据,每一个含有特征标签的数据称为一个资源包,所述存储模块包括索引组件,所述索引组件能够通过输入特征标签找到含有对应特征标签的所有资源包,当未通过认证时,所述认证模块向对应用户的本地终端发送拒绝信息;所述本地终端还包括操作模块、训练模块和显示模块,所述操作模块与所述服务中心连接,所述操作模块用于查询所述服务中心的所有资源包并下载需要的资源包,结合图2,所述操作模块包含三个互动区域,第一互动区域用于显示本地用户上传的资源包,第二互动区域用于显示所述服务中心的所有特征标签,所述第二互动区域中的特征标签具有两种状态,选中状态和未选中状态,通过单击所述特征标签能够在这两种状态之间进行切换,所述第三互动区域用于显示含有选中状态的特征标签的所有资源包,用户能够对所述第三互动区域中的资源包进行下载操作,下载完成后对应的资源包会添加一个已下载标志,具有已下载标志的资源包会始终在所述第三互动区域中显示但不会随特征标签状态的变化而变化,用户对已下载的资源包能够进行删除操作,删除后该已下载的资源包会除去已下载标志,在未满足选中状态的特征标签时不会显示在所述第三互动区域中,结合图3,
所述训练模块根据选择的资源包对模型进行训练,用户通过将第一互动区域中的资源包和第三互动区域中已下载的资源包拖拽至所述训练模块来完成对资源包的选择,所述训练模块设有一个开始按钮,单击所述开始按钮,训练模块加载与配置数据后启动模型训练,所述显示模块能够实现拖拉拽算法因子组件并对算法因子组件间逻辑关系进行串联,以及实时显示训练的状态,所述训练状态为模型参数的变化图,结合图4,用户在模型参数的变化图中能够选择任意一个时间点来获取该时刻下的模型,获取的模型会显示在所述显示模块中,模型的显示内容还包括该模型的模型参数,用户对显示的模型能够自定义命名,所述显示模块能够同时显示多个模型,通过在所述显示模块中输入待执行数据,所有获取的模型能够自动调用所述待执行数据并启动运行,运行的结果会显示在对应模型的结果区域中,所述显示模块中每个模型均具有一个导出按钮,通过单击导出按钮能够生成一个对应的可移植程序;所述可移植程序能够在独立的环境中运行,所述可移植程序能够作为一个建模模板上传至所述服务中心供其余用户下载使用;所述系统的整个工作流程包括如下步骤:s1、所述本地终端将本地的原始数据进行加密处理;s2、所述本地终端将加密数据赋予用户标签;s3、所述本地终端进行本地模型训练,将加密训练梯度数据上传至服务中心;s4、所述服务中心对接收到的加密训练梯度数据进行可信身份认证;s5、所述服务中心对通过认证的加密训练梯度数据进行特征计算,得到特征标签;s6、所述服务中心生成资源包并根据所述特征标签分类保存;s7、用户通过所述本地终端下载所述服务中心上的资源包;s8、用户将下载的资源包用于模型迭代训练;s9、所述本地终端显示建模过程、模型训练过程中的参数变化情况及模型运行对比情况,用户选择任意时间点获取对应的模型;s10、用户输入待执行数据,模型调用待执行数据后自动运行并显示运行结果;s11、用户根据多个模型的运行结果对比情况选择模型导出成可移植程序;结合图5,所述特征模块内设置有多个特征计算单元,每个特征计算单元对应一个特征标签,所述特征计算单元从接收的数据中选择对应的数据作为输入数据,所述输入数据经所述特征计算单元计算处理后得到一个输出值,当所述输出值处于设定范围内时,赋予该数据对应的特征标签,一份数据能够同时具有多个特征标签,所述服务中心给用户数据赋予特征标签并生成资源包的过程称为特征工程;所述服务中心还包括一个对齐模块,所述对齐模块用于对两个资源包进行对齐计算,用户在所述操作模块能够选择两个资源包进行对齐计算,所述对齐模块完成具体的计算后将对齐结果反馈给所述操作模块,用户根据对齐结果决定是否要下载资源包;每个特征标签具有多个子属类别,所述子属类别为对应的特征计算单元选择输入的数据类别,所述对齐模块根据资源包的特征标签及其子属类别来计算对齐结果,具体的计算步骤如下:s21、统计出资源包a拥有的特征标签数量、资源包b拥有的特征标签数量和
资源包a与资源包b共有的特征标签数量;s22、统计出资源包a拥有的所有子属类别数量、资源包b拥有的所有子属类别数量和资源包a与资源包b共有的子属类别数量;s23、计算出资源包a和资源包b的基础对齐值p1:;s24、计算出资源包a和资源包b的最终对齐值p2:;其中,at表示资源包a的特征标签集合,bt表示资源包b的特征标签集合,ai表示资源包a的第i个特征标签,bj表示资源包b的第j个特征标签,表示特征标签具有的子属类别集合,表示特征标签bj具有的子属类别集合,为子属类别重合函数,用于表示两个不同的特征标签的子属类别重合度;其中,;其中,n()表示集合的元素个数;步骤s24中的最终对齐值p2作为所述对齐模块计算的对齐结果;所述显示模块中还包括一个评价单元,所述评价单元根据每个模型的参数变化情况计算出对应模型的评价指标q,所述评价指标在所述显示模块中显示;所述评价指标q的取值越大,表示模型的效果越好,所述评价指标q的计算公式为:;其中,n表示模型的参数数量,表示第k个模型参数的评估值;所述模型参数的评估值用于表示参数的收敛性和稳定性的综合情况;的计算公式如下:;其中,为第k个模型参数的最近变化的m个取值的标准差,为第k个模型参数的最近变化的m个取值的平均数,为第k个模型参数的最近变化的2m个取值的标准差,为第k个模型参数的最近变化的2m个取值的平均数,m的具体取值由用户自行设定。
14.实施例三。
15.下面结合具体的应用场景对一些技术进行说明,本实施例应用于银行业务,在该业务下的特征模块中包含的特征计算单元包括大额特征计算单元、存储特征计算单元、回收特征计算单元等;所述大额特征计算单元统计出该银行一份数据中每个储户的存储总额,并计算出存储总额大于存储阈值的储户数量,所述大额特征计算单元统计出该银行一份数据中借贷给同一个用户的借贷总额,并计算出借贷总额大于借贷阈值的用户数量,所述大额特征计算单元根据下式计算出该银行的大额指数qb:;其中,为所有储户数量,为所有借贷用户数量;当所述大额指数qb大于阈值时,所述大额特征计算单元将赋予这份数据大额特征标签,所述大额特征标签的子属类别包括个体户、餐饮企业、教育企业、互联网企业等用户的属性;所述存储特征计算单元统计出该银行一份数据中每个储户的存取数据,并将存取数据进行如下处理:;其中,表示第i次存款金额,表示第i次存款时的已存款总额,表示第j次取款金额,表示第j次取款时的已存款总额,为存取款指数;所述存储特征计算单元统计出存取款指数大于存取阈值的储户数量和存取款指数小于存取阈值的储户数量,当所述大于等于所述时,所述存储特征计算单元赋予这份数据偏存特征标签,所述偏存特征标签的子属类别包括个体户、餐饮企业、教育企业、互联网企业等用户的属性,当所述小于所述时,所述存储特征计算单元赋予这份数据偏取特征标签,所述偏取特征标签的子属类别包括个体户、餐饮企业、教育企业、互联网企业等用户的属性;所述回收特征计算单元统计出该银行一份数据中的所有借贷项目数据,并且根据未到还款期、到还款期后全部偿还、到还款期后部分偿还和到还款期后未偿还进行分类,所述回收特征计算单元根据下式计算出回收指数qr:其中,表示未到还款期的项目数,表示到还款期后全部偿还的项目数,表
示到还款期后部分偿还的项目数,表示到还款期后未偿还的项目数,表示到还款期后全部偿还的总金额,表示到还款期后部分偿还的偿还总金额,表示到还款期后部分偿还的未偿还总金额,表示到还款期后未偿还的总金额,为所有借贷项目的总金额;当所述回收指数大于回收阈值,所述回收特征计算单元赋予这份数据回收特征标签,所述回收特征标签的子属类别包括个体户、餐饮企业、教育企业、互联网企业等用户的属性;本地有一份数据,这份数据经加密模块加密处理后通过所述标签模块添加用户标签,在通过所述传输模块上传到服务中心,服务中心的认证模块对上传的用户标签进行认证,认证通过后,所述特征模块将这份数据处理后得到的特征标签为大额特征标签、偏存特征标签和回收特征标签,大额特征标签下的子属类别为互联网企业和餐饮企业,偏存特征标签下的子属类别为个体户,回收特征标签下的子属类别为餐饮企业、教育企业和互联网企业,这份数据以资源包的形式保存在存储模块,该资源包可供其它用户查看下载;若服务中心存在一份资源包,该资源包的特征标签为偏取特征标签和回收特征标签时,偏取特征标签下的子属类别为个体户和餐饮企业,回收特征标签下的子属类别为个体户、餐饮企业、教育企业,该资源包可通过本地终端的操作模块进行查看,当在本地终端的操作模块上选择该资源包与本地资源包进行对比时,所述服务中心的对齐模块会计算本地资源包与该服务中心资源得最终对齐值,计算结果如下:;所述服务中心将计算结果反馈给本地终端的操作模块上进行显示,用户能够选择保留最终对齐值得小数点后四位,本实施例中的最终对齐值后四位是173,属于偏小的范畴,用户可以选择不下载该资源包而选择下载最终对齐值更大的资源包;资源包下载后被用于训练模块中,所述训练模块中设有联邦数据处理、联邦特征工程和联邦机器学习三个按钮,单击联邦数据处理按钮后会显示加载数据、纵向数据你拆分、数据统计、横向数据拆分、数据转换和隐私求交等子类别,单击联邦机器学习后会显示纵向线性回归、信用评分卡、横向逻辑回归、纵向逻辑回归、纵向泊松回归等子类别,所述子类别能够被拖拽至编辑区域,在所述编辑区域中形成一个条形框,所述条形框上设有两个输入点和两个输出点,在所述编辑区域中能够将一个条形框中的输出点与另一个条形框的输出点连接,使其产生逻辑关系,在本实施例中,将加载数据条形框、数据转换条形框、隐私求交条形框和纵向逻辑回归条形框依次连接,右键单击条形框后会弹出一个对话框用于选择参数或者数据,右键单击加载数据条形框后,会显示之前选择的数据包,在对话框中能够对这些数据包进行进一步的选择,右键单击数据转换条形框后,弹出的对话框中能够对是否填充缺失值,填充缺失值的具体数值和缺失值的填充方式进行操作,在是否填充缺失值中选择为否时,后两项处于灰色不可操作状态,在是否填充缺失值中选择为是时,后两项处于灰色可操作状态,在填充缺失值的具体数值中能够选择1至10中的自然数,在缺失值的填充方式中,能够选择min、max和mean三种方式中的其中一种,右键单击隐私求交条形框后,在弹出的对话框中能够对求交算法
和连接方式进行选择,右键单击纵向回归逻辑条形框后,在弹出的对话框中对惩罚方式、收敛容忍度、惩罚项系数、优化算法、学习率和最大迭代次数进行选择,所有参数选择完毕后,单击保存选项,根据编辑区域中的各条形框中的逻辑生成一个训练模型,点击训练模型的开始按钮后,按照训练模型中的逻辑开始进行训练;用户在所述显示模块中选择任意时间点生成具有对应参数值的模型,所述显示模块中的模型在运行后显示运行结果,所述显示模块能够显示多个模型运行结果的对比情况,用户在所述显示模块中能够导出模型并生成可移植程序。
16.以上所公开的内容仅为本发明的优选可行实施例,并非因此局限本发明的保护范围,所以凡是运用本发明说明书及附图内容所做的等效技术变化,均包含于本发明的保护范围内,此外,随着技术发展其中的元素是可以更新的。
技术特征:1.一种基于多用户加密的联邦学习可视化系统,其特征在于,包括本地终端和服务中心,所述本地终端包括加密模块、标签模块、传输模块、操作模块、训练模块和显示模块,所述服务中心包括认证模块、特征模块、存储模块和对齐模块,所述加密模块用于对本地数据进行加密处理,所述标签模块用于给加密数据添加用户标签,所述传输模块用于在本地终端与服务中心间进行数据传输,所述操作模块用于查询、下载所述服务中心的数据资源,所述训练模块用于根据下载的数据资源对模型进行训练,所述显示模块用于显示模型的训练过程以及模型的对比情况,所述认证模块用于对接收的加密数据的用户标签进行可信认证,所述特征模块用于对接收的加密数据进行特征计算并赋予特征标签,所述存储模块将所述加密数据以资源包的形式进行存储,所述对齐模块用于计算两个资源包之间的对齐结果;所述特征模块内设置有多个特征计算单元,每个特征计算单元对应一个特征标签,每个特征标签具有多个子属类别,所述子属类别为对应的特征计算单元选择输入的数据类别,所述对齐模块根据下式计算出最终对齐值p2,p2越大代表两个资源包之间的对齐结果越好,此时,用户可根据该对齐值p2决定是否下载资源包:;其中,为资源包a拥有的特征标签数量,为资源包b拥有的特征标签数量,为资源包a与资源包b共有的特征标签数量,为资源包a拥有的所有子属类别数量,为资源包b拥有的所有子属类别数量,为资源包a与资源包b共有的子属类别数量,at表示资源包a的特征标签集合,bt表示资源包b的特征标签集合,ai表示资源包a的第i个特征标签,bj表示资源包b的第j个特征标签,表示特征标签具有的子属类别集合,表示特征标签bj具有的子属类别集合,为子属类别重合函数,用于表示两个不同的特征标签的子属类别重合度;其中,;其中,n()表示集合的元素个数;用户通过在所述操作模块中选择资源包计算对齐结果,并根据对齐结果选择下载资源包用于所述训练模块,所述显示模块能够以拖拉拽算法因子组件的形式方便用户建模、显示建模过程、模型训练过程中参数变化情况及模型运行对比情况,用户在所述显示模块中选择任意时间点生成具有对应参数值的模型,所述显示模块中的模型在运行后显示运行结果,所述显示模块能够显示多个模型运行结果的对比情况,用户在所述显示模块中能够导出模型并生成可移植程序。2.如权利要求1所述的一种基于多用户加密的联邦学习可视化系统,其特征在于,所述操作模块包含三个互动区域,第一互动区域用于显示本地用户上传的资源包,第二互动区域用于显示所述服务中心的所有特征标签,所述第二互动区域中的特征标签具有选中状态或未选中状态,所述第三互动区域用于显示含有选中状态的特征标签的所有资源包。
3.如权利要求2所述的一种基于多用户加密的联邦学习可视化系统,其特征在于,用户能够在所述操作模块中下载需要的资源包,并将第一互动区域中的资源包和第三互动区域中已下载的资源包拖拽至所述训练模块中,启动所述训练模块后,所述训练模块根据含有的资源包进行模型训练。4.如权利要求3所述的一种基于多用户加密的联邦学习可视化系统,其特征在于,所述特征计算单元从接收的数据中选择对应的数据作为输入,所述输入经所述特征计算单元计算处理后得到一个输出值,当所述输出值处于设定范围内时,赋予该数据对应的特征标签,一份数据能够同时具有多个特征标签。5.如权利要求4所述的一种基于多用户加密的联邦学习可视化系统,其特征在于,所述显示模块中还包括评价单元,所述评价单元根据每个模型的参数变化情况计算出对应模型的评价指标q,所述评价指标在所述显示模块中显示;所述评价指标q的计算公式为:;其中,n表示模型的参数数量,表示第k个模型参数的评估值;的计算公式为:;其中,为第k个模型参数最近变化的m个取值的标准差,为第k个模型参数最近变化的m个取值的平均数,为第k个模型参数最近变化的2m个取值的标准差,为第k个模型参数最近变化的2m个取值的平均数,m的具体取值由用户自行设定;所述模型参数的评估值用于表示参数的收敛性和稳定性的综合情况。6.一种用于权利要求5所述的联邦学习可视化系统的基于多用户加密的联邦学习可视化方法,其特征在于,包括如下步骤:s1、所述本地终端将本地的原始数据进行加密处理;s2、所述本地终端将加密数据赋予用户标签;s3、所述本地终端进行本地模型训练,将加密训练梯度数据上传至服务中心;s4、所述服务中心对接收到的加密训练梯度数据进行可信身份认证;s5、所述服务中心对通过认证的加密训练梯度数据进行特征计算,得到特征标签;s6、所述服务中心生成资源包并根据所述特征标签分类保存;s7、用户通过所述本地终端下载所述服务中心上的资源包;s8、用户将下载的资源包用于模型迭代训练;s9、所述本地终端显示建模过程、模型训练过程中的参数变化情况及模型运行对比情况,用户选择任意时间点获取对应的模型;s10、用户输入待执行数据,模型调用待执行数据后自动运行并显示运行结果;s11、用户根据多个模型的运行结果对比情况选择合适的模型导出成可移植程序。
技术总结本发明提供了一种基于多用户加密的联邦学习可视化系统与方法,包括本地终端和服务中心。所述本地终端用于完成模型的建立、训练以及结果的显示,所述服务中心用于接收各个本地终端发送的数据并对预处理后的数据以资源包形式进行保存;所述服务中心设有特征模块用于对接收的加密数据进行特征计算并赋予特征标签,所述服务中心设有对齐模块用于计算两个资源包之间的对齐结果。用户通过本地终端的操作模块能够自由选择合适的资源包作为训练数据,本地终端的显示模块能够以拖拉拽算法因子组件的形式方便用户建模、显示建模过程、模型训练过程、参数变化情况以及模型运行对比情况。本系统在训练数据和生成模型的选择上具有极大的选择自由度。大的选择自由度。大的选择自由度。
技术研发人员:武铁铮 薛金燕 田璐璐
受保护的技术使用者:青岛鑫晟汇科技有限公司
技术研发日:2022.06.02
技术公布日:2022/7/5