一种基于安全两方计算的输入信息隐私保护系统与方法

allin2024-07-26  98



1.本发明涉及隐私安全领域,尤其涉及一种基于安全两方计算的输入信息隐私保护系统与方法。


背景技术:

2.近年来,随着即时通讯技术的快速发展,人们可以享受任意时间任意地点不受限制地交流,文字作为信息的主要载体,需要我们先使用键盘或者语音输入再传递到远方。其中,智能输入法软件扮演着不可或缺的作用,其作用主要是通过识别用户与键盘或者屏幕的交互,将用户所要表达的信息输入到智能设备上,其应用领域非常广泛,例如搜索、聊天、笔记等。
3.随着机器学习技术的进步,目前的输入法已经从简单的打字机版本升级成了集合智能联想、智能配图、ai帮写、语音输入、智能校对等高级功能(统称为智能联想)的智能输入法。智能联想是指智能输入法中的一种功能,当用户输入一个词汇或一段话之后,程序提取用户输入的关键词,通过与语料库进行对比,预测出用户接下来可能的输入,然后显示给用户作为备选,这样就节省了用户输入的时间提高了输入效率。智能配图是智能输入法根据用户输入的关键词来智能推荐符合用户所想表达意思的图片或表情包的一种技术。即时聊天软件已经成了我们生活中必不可少的一部分,聊天过程中,人们经常通过表情包和图片来进行更高效的进行更生动的表达,通过用户的键入来智能推荐符合语境的表情包或图片已经成为一个非常重要和火热的智能输入法功能。ai帮写是智能输入法的一项最新功能,它可以根据用户的键入推测用户要表达的情绪或描述的场景,根据这些信息来推送已经编辑得当的语句来让聊天者表达得更加完美,这项功能对ai技术要求很高,目前仍在发展阶段,现阶段主要是通过相似度比较来推荐语料库中的语句。
4.智能输入法的出现使得用户键盘输入的过程变得轻松高效,也让输入的内容变得更生动有趣,因此获得了广大智能手机用户的青睐。同时,为了能够将上述智能化的服务提供给用户,智能输入法后台需要将用户的输入内容上传,上传之后再使用机器学习算法来进行预测和推理,从而得到智能联想的结果,从理论上讲,数据离开本地后的安全性无法得到保障,智能输入法可以根据用户的输入内容来预测用户行为进而产生许多商业行为,因此技术进步的方向是在提供这些服务的同时保障用户隐私安全。
5.苗功勋等人在中国发明专利申请“一种具有信息加密功能的手机输入法的实现方法及系统”(申请号为cn202011632602.0)中提出一种在信息传输前对数据进行加密,传输完成后再对数据进行解密,也就是通过加密处理来保证通信数据的安全性。该方法的加密功能仅限于数据传输的过程中,可以防范数据在传输过程中被截获。但是,该方案无法保证数据解密后不被泄露,不具备防范服务端数据泄露的能力。
6.费腾等人在中国发明专利申请“一种用于隐私保密的方法及装置”(申请号为cn201910156868.3)中公开了一种应用于输入法客户端的隐私保密方法。该方法包括:当监测到用户对电子设备进行操作时,采集所述用户的生物特征数据;将所述用户的生物特征
数据与所述电子设备中的预设生物特征数据进行匹配;若匹配失败,则对所述电子设备中的隐私数据进行加密。该发明实现电子设备在被借用时,隐私数据不会泄露,保证了数据安全的技术效果。但是,该发明无法保证输入法提供商服务器对数据的使用,不具备防范服务端数据泄露的能力。
7.因此,本领域的技术人员致力于开发一种新的输入信息隐私保护系统与方法,解决现有技术方案中存在的用户数据从客户端上传至服务器端进行数据挖掘和智能推理时存在的用户隐私数据可能泄露的缺陷,如解密后可能发生隐私泄露或者在服务端的数据可能出现泄露的缺陷。


技术实现要素:

8.有鉴于现有技术的上述缺陷,本发明所要解决的技术问题是在用户使用智能输入法过程中用户数据从客户端上传至服务器端进行数据挖掘和智能推理时如何避免出现用户隐私数据的泄露,从而达到用户隐私数据的保护。
9.为实现上述目的,本发明提供了一种基于安全两方计算的输入信息隐私保护系统与方法,使得用户在使用智能输入法的过程中既智能又安全。
10.本发明提供的一种基于安全两方计算的输入信息隐私保护系统,包括:
11.安全两方计算协议模块,所述安全两方计算协议模块提供秘密共享技术;
12.客户端,所述客户端包括信息输入模块,所述信息输入模块使用所述秘密共享技术将接收的输入数据转换为两个份额的加法秘密共享形式的数据;所述客户端还包括用户语料库模块,所述用户语料库模块连接所述信息输入模块,并接收其中一个份额的所述加法秘密共享形式的数据;
13.私有服务器端,所述私有服务器端连接所述客户端,包括智能联想算法模块,所述智能联想算法模块又包含内置有智能联想算法的第一预测模型,所述智能联想算法模块接收另外一个份额的所述加法秘密共享形式的数据,通过所述第一预测模型中的所述智能联想算法计算获得秘密共享形式下的第一预测结果,即第一密文形式预测结果,所述第一密文形式预测结果的一半在所述客户端,另一半在所述私有服务器端;
14.第三方公有云服务器端,所述第三方公有云服务器端接收所述第一密文形式预测结果,包括所述客户端上的一半和所述私有服务器端上的另一半,并重建得到第一明文形式预测结果,再将所述第一明文形式预测结果发送给所述客户端。
15.进一步地,所述私有服务器端还包括:
16.用户偏好联想模块,所述用户偏好联想模块连接所述用户语料库模块,接收所述用户语料库模块的输出并训练第二预测模型,当所述第二预测模型的预测准确率达到预先设定的阈值的时候,则将所述第二预测模型作为所述用户偏好联想模块的输出发送到所述智能联想算法模块;所述智能联想算法模块通过所述安全两方计算协议模块提供的所述秘密共享技术计算得出所述第二预测模型的第二预测结果,所述第二预测结果也是所述加法秘密共享形式,即第二密文形式预测结果,一半位于所述客户端,另一半位于所述私有服务器端;所述客户端和所述私有服务器端将各自的一半发送给所述第三方公有云服务器端,所述第三方公有云服务器端将第二密文形式预测结果重建得到第二明文形式预测结果,再将所述第二明文形式预测结果发送给所述客户端。
17.进一步地,所述第二预测模型为lstm网络模型。
18.进一步地,所述加法秘密共享形式为2-out-of-2。
19.进一步地,所述智能联想算法模块使用的算法为k-means聚类算法。
20.进一步地,所述用户语料库模块分为更新区、缓存区、工作区、语料库区;所述更新区是基于队列的存储,用来对所述输入数据进行实时的记录和预测;所述缓存区用于缓存所述输入数据,用来提供训练;所述工作区用于对所述输入数据语进行整合、去重,存储到所述语料库区。
21.进一步地,所述用户偏好联想模块将所述用户语料库模块的所述更新区的输出作为所述第二预测模型的输入,并使用所述第二预测模型对所述用户语料库模块的所述缓存区进行训练。
22.本发明还提供一种基于安全两方计算的输入信息隐私保护方法,所述方法包括以下步骤:
23.步骤1、位于客户端的信息输入模块将接收的输入数据进行分词、筛选、编码,再借助安全两方计算协议模块中的秘密共享技术将所述输入数据转换为两个份额的加法秘密共享形式;
24.步骤2、位于私有服务器端的智能联想算法模块接收其中一个份额的所述加法秘密共享形式的所述输入数据,内置于所述智能联想算法模块中的具有智能联想算法的第一预测模型进行预测,得到秘密共享形式下的第一预测结果,即第一密文形式预测结果,所述第一密文形式预测结果的一半在所述客户端,另一半在所述私有服务器端;
25.步骤3、位于所述客户端的用户语料库模块接收另外一个份额的所述加法秘密共享形式的所述输入数据,所述输入数据进入所述用户语料库模块的更新区,在所述更新区检查位于所述私有服务器端的所述用户偏好联想模块中的第二预测模型是否存在;若所述第二预测模型不存在,则所述输入数据进入缓存区,为所述第二预测模型的训练提供数据;若所述用户偏好联想模块中的所述第二预测模型存在,则所述第二预测模型对位于所述用户语料库模块的所述更新区的所述输入数据进行预测,得出所述第二预测模型的第二预测结果,所述第二预测结果也是所述加法秘密共享形式,即第二密文形式预测结果,一半位于所述客户端,另一半位于所述私有服务器端;
26.步骤4、将所述第一密文形式预测结果和所述第二密文形式预测结果发送给所述第三方公有云服务器端,所述第三方公有云服务器端按照密文形式的预测结果提取存储在云端语料库模块中的海量文字表达,包括短语、名句、经典语句、日常用句,以及当前热门的图片和表情包发送给所述客户端,获得智能联想的最终结果。
27.进一步地,所述第一预测模型使用的算法为k-means聚类算法。
28.进一步地,所述第二预测模型为lstm网络模型。
29.本发明提供了一种基于安全两方计算的输入信息隐私保护系统与方法至少具有以下技术效果:
30.1、本发明所提供的技术方案提出了智能输入法智能联想功能中存在的隐私泄露问题的安全多方计算解决方案,设计了用户与服务提供商之间的能够支持k-means聚类和长短期记忆网络的安全两方计算协议,确保在半诚实敌手的安全假设下用户键盘输入内容不离开本地,同时智能联想结果对服务提供商保密,使得安全性大大增强;
31.2、本发明所提供的技术方案引入第三方公有云服务器,负责预测结果的重构并向用户发送预测结果关联的语料、图片以及表情包等,使得用户输入内容受到更大程度的保护;
32.3、本发明所提供的技术方案提出输入法智能联想功能中的用户定制模块,针对用户使用的个性化和数据隐私安全以及效率的问题,设计用户数据隐私安全与数据价值相结合的全周期解决方案,通过智能联想算法用户定制对智能联想系统的耦合来进一步提高输入法智能联想的预测效率和预测置信度,进一步改善用户的使用体验。
33.以下将结合附图对本发明的构思、具体结构及产生的技术效果作进一步说明,以充分地了解本发明的目的、特征和效果。
附图说明
34.图1是本发明的一个较佳实施例的工作过程示意图。
具体实施方式
35.以下参考说明书附图介绍本发明的多个优选实施例,使其技术内容更加清楚和便于理解。本发明可以通过许多不同形式的实施例来得以体现,本发明的保护范围并非仅限于文中提到的实施例。
36.现有技术没有考虑用户输入的隐私性问题。以往用户打字因为没有引入智能联想功能,只需要本地软件支持,然而随着技术的进步,服务提供商将用户输入从本地上传到服务器以实现智能联想。在这一过程中,用户的输入信息也就是对话内容存在泄露的潜在风险并可能不受用户控制被服务提供商用于商业活动中,随着人们隐私保护意识的觉醒,这样的“小问题”将会成为用户使用智能输入法时所要考虑的一个重要方面,因此一个具有隐私保护机器学习功能的智能输入法将会越来越受到人们的重视。
37.隐私计算是面向隐私信息全生命周期保护的计算理论和方法,是隐私信息的所有权、管理权和使用权分离时隐私度量、隐私泄漏代价、隐私保护与隐私分析复杂性的可计算模型与公理化系统。目前的隐私计算主要包括安全多方计算(secure multi-party computation,smpc)、联邦学习、可信执行环境、差分隐私、数据脱敏等。
38.安全多方计算的研究主要是针对无可信第三方的情况下,如何安全地计算一个约定函数的问题。安全多方计算是电子选举、门限签名以及电子拍卖等诸多应用得以实施的密码学基础。在安全多方计算协议中,参与协议的各方仅知晓己方的输入信息并有选择的知晓运算结果,参与协议的其他各方的输入数据及运算的中间结果完全对其他参与方保密。
39.机器学习专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能,其工作方式主要是利用用户的行为来训练计算机,使得计算机具备一定的判断和预测功能。
40.秘密共享(secret share,ss)是一种将秘密分割存储的密码技术,目的是阻止秘密过于集中,以达到分散风险和容忍入侵的目的,是信息安全和数据保密中的重要手段。秘密共享的思想是将秘密以适当的方式拆分,拆分后的每一个份额由不同的参与者管理,单个参与者无法恢复秘密信息,只有若干个参与者一同协作才能恢复秘密消息。更重要的是,
当其中任何相应范围内参与者出问题时,秘密仍可以完整恢复。秘密共享的关键是怎样更好的设计秘密拆分方式和恢复方式。
41.本发明涉及使用秘密分享和安全两方计算等密码学技术手段,解决输入法软件为用户提供智能联想、智能配图、ai帮写等功能的同时,读取用户输入的私密信息所带来的隐私泄露问题。本发明所提供的技术方案运用安全多方计算技术,在数据传输和处理的全过程中,数据会以秘密共享的形式存在,因此数据明文不会被任何一方看到,从而有效地解决了智能输入法工作过程全链路的隐私保护问题。
42.具体来说,本发明提供的一种基于安全两方计算的输入信息隐私保护系统包括智能输入法的一整套隐私保护机制,当前智能输入法主要功能分为两种:第一是可以完全在本地执行的基础打字功能,离线状态下仍能工作,信息在本地无需上传;第二是机器学习算法支持的部署在软件所有者的私有服务器端的智能联想功能,用户使用这些功能时软件会自动将输入的内容上传至私有服务器端,私有服务器端使用k-means聚类和长短期记忆网络(longshort-term memory,lstm)两种机器学习算法来实现上述功能。本发明所提供的技术方案通过部署客户端和私有服务器端的安全两方计算协议,在用户使用智能联想功能时,将输入数据转为秘密共享后上传,之后私有服务器端和客户端在安全两方计算协议下完成智能联想功能并将秘密共享形势下的结果发送给云端语料库所在的第三方公有云服务器端,最终第三方公有云服务器端将智能联想的结果直接发送给用户,在整个过程中私有服务器端只能获取中间过程和计算结果的秘密共享因而有效保护用户的输入内容。
43.如图1所示,为本发明提供的一种基于安全两方计算的输入信息隐私保护系统的工作过程示意图,所述系统包括:
44.安全两方计算协议模块,提供秘密共享技术,包括:线性运算、非线性运算、相似度度量和距离比较。安全两方计算协议模块在客户端和私有服务器端的安全两方计算协议,在用户使用智能联想功能时,将输入数据转为秘密共享后上传,之后私有服务器端和客户端在安全两方计算协议下完成智能联想功能并将秘密共享形势下的结果发送给云端语料库所在的第三方公有云服务器端。安全两方协议模块是本发明的核心部分,负责实现所有计算工作的加密服务,使用密码学中的秘密共享和不经意传输来实现各个算子模块的安全两方计算子协议,安全两方计算可以保证参与协议的各方仅知晓己方的输入信息并根据协议获取计算结果,参与协议的其他各方的输入数据完全对其他参与方保密,运算的中间结果全部以秘密共享的形式来存储、传输和使用。
45.客户端包括信息输入模块,主要负责从用户键盘输入的文字内容中提取关键词并将其转化为数学表达。其工作过程包括:首先,使用字符串匹配分词法对输入文字进行分词并筛选关键词,其次,根据预先设计好的字典库对关键词进行字符编码,最后,使用秘密共享技术将关键词的字符编码转换成秘密分享值。特别地,信息输入模块使用2-out-of-2的秘密共享技术将接收的输入数据转换为两个份额的加法秘密共享形式的数据。2-out-of-2是秘密共享的一种,使用t-out-of-n来为秘密共享做定义,其中n是指将信息分成n份并分享给n个参与方,t是指参与方的数量大于等于t时可以还原原始信息。
46.客户端还包括用户语料库模块,用户语料库模块连接信息输入模块,并接收其中一个份额的加法秘密共享形式的数据。用户语料库模块是针对于用户私人输入偏好的定制模块,客户端针对用户的输入的前后语料内容进行整合,去重,最后输出形成用户的私人加
密语料库,用户语料库模块分为更新区、缓存区、工作区、语料库区。更新区基于队列的存储,用来对用户的输入进行实时的记录和预测,缓存区用于缓存用户的输入用来提供训练,工作区用于对语料进行整合、去重的工作,之后把整合的语料,存储在用户语料库区。
47.私有服务器端,私有服务器端连接客户端,包括智能联想算法模块,智能联想算法模块又包含内置有智能联想算法的第一预测模型,智能联想算法模块接收另外一个份额的加法秘密共享形式的数据,通过第一预测模型中的智能联想算法计算获得秘密共享形式下的第一预测结果,即第一密文形式预测结果,第一密文形式预测结果的一半在客户端,另一半在私有服务器端。智能联想算法模块的主要功能是将客户端上传的关键词作为人工智能算法的输入,使用机器学习算法智能匹配相似度高的词群,进而提供智能联想、智能配图、ai帮写三大功能。本模块主要采用的机器学习算法是聚类算法,相比于其他机器学习算法,聚类算法更适于多类别问题,非常适合智能联想这一应用场景。特别地,智能联想算法模块使用的算法为k-means聚类算法。
48.私有服务器端还包括用户偏好联想模块。用户偏好联想模块连接用户语料库模块,接收用户语料库模块的输出并训练第二预测模型,当第二预测模型的预测准确率达到预先设定的阈值的时候,则将第二预测模型作为用户偏好联想模块的输出发送到智能联想算法模块;智能联想算法模块通过安全两方计算协议模块提供的秘密共享技术计算得出第二预测模型的第二预测结果,第二预测结果也是加法秘密共享形式,即第二密文形式预测结果,一半位于客户端,另一半位于私有服务器端。其中,第二预测模型为lstm网络模型。用户偏好联想模块是针对于用户私人输入偏好的定制模块,私有服务器端针对用户语料库模块,使用搭建好的lstm网络对用户的语料库的缓存区进行训练,并定期输出模型,将用户语料库模块的更新区的输出作为模型预测的输入,当预测准确率达到一定阈值的时候,则将模型作为用户偏好联想模块投入使用。
49.客户端和私有服务器端将各自的预测结果发送给第三方公有云服务器端,第三方公有云服务器端将预测结果重建得到明文形式的预测结果,再将结果直接发送到客户端。第三方公有云服务器端包括云端语料库模块。由于体量较大,一般采用第三方公有云服务器来提供存储空间,该模块负责存储智能输入法的海量文字表达包括短语、名句、经典语句、日常用句,以及当前热门的图片和表情包。在本发明中,云端语料库根据客户端和服务器端的输入来向客户端发送相应的即时聊天智能联想内容。
50.还包括交互通信模块,该模块是根据安全两方协议模块发出的交互通信请求,实现用户客户端与智能输入法提供商的服务器之间的交互通信。
51.本发明还提供一种基于安全两方计算的输入信息隐私保护方法,包括如下步骤:
52.用户在客户端使用智能输入法的智能联想功能时,使用智能联想算法模块的机器学习算法找到和用户输入相关的语料信息,通过信息输入的秘密共享形式以及安全两方计算协议所带来的安全计算保障在聚类算法预测过程中用户输入的安全。参与到安全三方计算中的各方分别是用户所使用的客户端、智能输入法软件的私有服务器端、第三方公有云服务器端。在产生智能联想任务指令时,客户端将用户输入转为2-out-of-2的加法秘密共享形式并将其中一个份额传输给输入法软件的私有服务器端,二者通过已训练的安全两方的k-means聚类算法和lstm网络来实现根据用户输入的智能联想,在客户端和私有服务器端得到输出结果的秘密共享后,按照协议将各自的秘密份额发送给第三方公有云服务器
端,第三方公有云服务器端将二者发送的秘密份额重建得到预测结果然后将对应的语料或图片表情包直接发送给客户端。上述过程实现了用户在半诚实敌手的安全模型下确保输入内容保密并进行智能输入法的智能联想,即使第三方公有云和软件私有服务器串通,也只能得到预测结果,很难对输入内容有方向性的判断。
53.具体来说,该方法包括以下步骤:
54.步骤1、位于客户端的信息输入模块将接收的输入数据进行分词、筛选、编码,再借助安全两方计算协议模块中的秘密共享技术将输入数据转换为两个份额的加法秘密共享形式;
55.步骤2、位于私有服务器端的智能联想算法模块接收其中一个份额的加法秘密共享形式的输入数据,内置于智能联想算法模块中的具有智能联想算法的第一预测模型进行预测,得到秘密共享形式下的第一预测结果,即第一密文形式预测结果,第一密文形式预测结果的一半在客户端,另一半在私有服务器端;
56.步骤3、位于客户端的用户语料库模块接收另外一个份额的加法秘密共享形式的输入数据,输入数据进入用户语料库模块的更新区,在更新区检查位于私有服务器端的用户偏好联想模块中的第二预测模型是否存在;若第二预测模型不存在,则输入数据进入缓存区,为第二预测模型的训练提供数据;若用户偏好联想模块中的第二预测模型存在,则第二预测模型对位于用户语料库模块的更新区的输入数据进行预测,得出第二预测模型的第二预测结果,第二预测结果也是加法秘密共享形式,即第二密文形式预测结果,一半位于客户端,另一半位于私有服务器端;
57.步骤4、将第一密文形式预测结果和第二密文形式预测结果发送给第三方公有云服务器端,第三方公有云服务器端按照密文形式的预测结果提取存储在云端语料库模块中的海量文字表达,包括短语、名句、经典语句、日常用句,以及当前热门的图片和表情包发送给客户端,获得智能联想的最终结果。
58.其中,第一预测模型使用的算法为k-means聚类算法。
59.其中,第二预测模型为lstm网络模型。
60.以上详细描述了本发明的较佳具体实施例。应当理解,本领域的普通技术无需创造性劳动就可以根据本发明的构思作出诸多修改和变化。因此,凡本技术领域中技术人员依本发明的构思在现有技术的基础上通过逻辑分析、推理或者有限的实验可以得到的技术方案,皆应在由权利要求书所确定的保护范围内。

技术特征:
1.一种基于安全两方计算的输入信息隐私保护系统,其特征在于,所述系统包括:安全两方计算协议模块,所述安全两方计算协议模块提供秘密共享技术;客户端,所述客户端包括信息输入模块,所述信息输入模块使用所述秘密共享技术将接收的输入数据转换为两个份额的加法秘密共享形式的数据;所述客户端还包括用户语料库模块,所述用户语料库模块连接所述信息输入模块,并接收其中一个份额的所述加法秘密共享形式的数据;私有服务器端,所述私有服务器端连接所述客户端,包括智能联想算法模块,所述智能联想算法模块又包含内置有智能联想算法的第一预测模型,所述智能联想算法模块接收另外一个份额的所述加法秘密共享形式的数据,通过所述第一预测模型中的所述智能联想算法计算获得秘密共享形式下的第一预测结果,即第一密文形式预测结果,所述第一密文形式预测结果的一半在所述客户端,另一半在所述私有服务器端;第三方公有云服务器端,所述第三方公有云服务器端接收所述第一密文形式预测结果,包括所述客户端上的一半和所述私有服务器端上的另一半,并重建得到第一明文形式预测结果,再将所述第一明文形式预测结果发送给所述客户端。2.如权利要求1所述的基于安全两方计算的输入信息隐私保护系统,其特征在于,所述私有服务器端还包括:用户偏好联想模块,所述用户偏好联想模块连接所述用户语料库模块,接收所述用户语料库模块的输出并训练第二预测模型,当所述第二预测模型的预测准确率达到预先设定的阈值的时候,则将所述第二预测模型作为所述用户偏好联想模块的输出发送到所述智能联想算法模块;所述智能联想算法模块通过所述安全两方计算协议模块提供的所述秘密共享技术计算得出所述第二预测模型的第二预测结果,所述第二预测结果也是所述加法秘密共享形式,即第二密文形式预测结果,一半位于所述客户端,另一半位于所述私有服务器端;所述客户端和所述私有服务器端将各自的一半发送给所述第三方公有云服务器端,所述第三方公有云服务器端将第二密文形式预测结果重建得到第二明文形式预测结果,再将所述第二明文形式预测结果发送给所述客户端。3.如权利要求2所述的基于安全两方计算的输入信息隐私保护系统,其特征在于,所述第二预测模型为lstm网络模型。4.如权利要求1所述的基于安全两方计算的输入信息隐私保护系统,其特征在于,所述加法秘密共享形式为2-out-of-2。5.如权利要求1所述的基于安全两方计算的输入信息隐私保护系统,其特征在于,所述智能联想算法模块使用的算法为k-means聚类算法。6.如权利要求2所述的基于安全两方计算的输入信息隐私保护系统,其特征在于,所述用户语料库模块分为更新区、缓存区、工作区、语料库区;所述更新区是基于队列的存储,用来对所述输入数据进行实时的记录和预测;所述缓存区用于缓存所述输入数据,用来提供训练;所述工作区用于对所述输入数据语进行整合、去重,存储到所述语料库区。7.如权利要求6所述的基于安全两方计算的输入信息隐私保护系统,其特征在于,所述用户偏好联想模块将所述用户语料库模块的所述更新区的输出作为所述第二预测模型的输入,并使用所述第二预测模型对所述用户语料库模块的所述缓存区进行训练。8.一种基于安全两方计算的输入信息隐私保护方法,其特征在于,所述方法包括以下
步骤:步骤1、位于客户端的信息输入模块将接收的输入数据进行分词、筛选、编码,再借助安全两方计算协议模块中的秘密共享技术将所述输入数据转换为两个份额的加法秘密共享形式;步骤2、位于私有服务器端的智能联想算法模块接收其中一个份额的所述加法秘密共享形式的所述输入数据,内置于所述智能联想算法模块中的具有智能联想算法的第一预测模型进行预测,得到秘密共享形式下的第一预测结果,即第一密文形式预测结果,所述第一密文形式预测结果的一半在所述客户端,另一半在所述私有服务器端;步骤3、位于所述客户端的用户语料库模块接收另外一个份额的所述加法秘密共享形式的所述输入数据,所述输入数据进入所述用户语料库模块的更新区,在所述更新区检查位于所述私有服务器端的所述用户偏好联想模块中的第二预测模型是否存在;若所述第二预测模型不存在,则所述输入数据进入缓存区,为所述第二预测模型的训练提供数据;若所述用户偏好联想模块中的所述第二预测模型存在,则所述第二预测模型对位于所述用户语料库模块的所述更新区的所述输入数据进行预测,得出所述第二预测模型的第二预测结果,所述第二预测结果也是所述加法秘密共享形式,即第二密文形式预测结果,一半位于所述客户端,另一半位于所述私有服务器端;步骤4、将所述第一密文形式预测结果和所述第二密文形式预测结果发送给所述第三方公有云服务器端,所述第三方公有云服务器端按照密文形式的预测结果提取存储在云端语料库模块中的海量文字表达,包括短语、名句、经典语句、日常用句,以及当前热门的图片和表情包发送给所述客户端,获得智能联想的最终结果。9.如权利要求8所述的基于安全两方计算的输入信息隐私保护方法,其特征在于,所述第一预测模型使用的算法为k-means聚类算法。10.如权利要求8所述的基于安全两方计算的输入信息隐私保护方法,其特征在于,所述第二预测模型为lstm网络模型。

技术总结
本发明公开了一种基于安全两方计算的输入信息隐私保护系统与方法,涉及隐私安全领域,所述系统包括:安全两方计算协议模块,安全两方计算协议模块提供秘密共享技术。客户端,包括信息输入模块,使用秘密共享技术将接收的输入数据转换为两个份额的加法秘密共享形式的数据;还包括用户语料库模块,接收其中一个份额的加法秘密共享形式的数据。私有服务器端,包括智能联想算法模块和第一预测模型,智能联想算法模块接收另外一个份额的加法秘密共享形式的数据,通过第一预测模型计算获得第一预测结果,即第一密文形式预测结果;第三方公有云服务器端,接收第一密文形式预测结果,重建得到第一明文形式预测结果,再发送给客户端。端。端。


技术研发人员:姚致远 谢红军 刘家甫 杨根科 褚健
受保护的技术使用者:上海交通大学宁波人工智能研究院
技术研发日:2022.05.06
技术公布日:2022/7/5
转载请注明原文地址: https://www.8miu.com/read-15696.html

最新回复(0)