云时代的安全挑战-运营商泄露数据隐私
安全一直是制约云计算发展的主要问题,很多企业选择将非关键应用部署到公有云上,关键应用部署在本地私有云——对于公有云安全问题的担忧是催生混合云的一个主要技术原因。企业对于公有云安全最根本的担忧是云计算运营商对数据的保密问题——企业把应用和数据放到公有云上,公有云运营商泄露数据,企业是无法防范的。
对于运营商保密的担忧已经成为云计算的时代性技术挑战。云计算出现以来,数据的所有者和使用者正在不断分离,越来越多的企业和政府在向云环境迁移,将系统和数据托管在第三方云平台上。
同态加密是目前被认为解决这个问题最好、最有前景的技术。
同态加密——过程加密
同态加密(Homomorphic encryption,HE)是基于数学难题中计算复杂性理论的密码学技术,其目的是解决外包计算(outsourced computation)中数据隐私和安全保密问题。同态加密的直观定义是一种数据加密形式,它允许人们对加密的数据进行特定的代数运算得到加密的输出,将加密的输出解密所得到的结果与对明文进行指定的运算结果一致。一个同态加密方案包含四个过程:
(1) 同态加密系统:系统管理者生成各过程所需的参数和密钥,建立同态加密系统。
(2) 明文加密过程:数据拥有者利用公钥对明文数据进行加密获得密文,以保护数据隐私。
(3) 密文计算过程:数据处理者利用公钥对密文进行同态计算获得密文输出。
(4) 密文解密过程:数据拥有者利用私钥对密文输出进行解密获得计算结果。
通俗的说,使用云计算的过程,相当于消费者把黄金(数据)交给金匠加工(计算)成为首饰(结果)的过程。消费者带着的原材料去首饰店交付(外包)给工匠做首饰,又不希望工匠看到自己的原材料具体是什么,以防暴露自己的财产。这时候消费者就需要一个特殊的盒子(同态加密系统),将自己的原材料装进盒子里面并锁住(明文加密)。这个盒子只有消费者自己的钥匙能打开,工匠也可以通过盒子上两个不透光的孔将手和工具伸入里面对原材料进行加工(密文计算),但是从盒子外面是看不到里面任何物体。工匠在盒子里面加工完成后,消费者将盒子打开(密文解密)拿到自己想要的首饰。
同态的应用-云、区块链、AI……
同态加密仍然是一个非常新颖和前沿的领域,其理论在1978 年首次推出,被认为是密码学领域的圣杯之一,直到目前为止仍像传奇一样遥不可及。最近的重要发展是计算机科学家Craig Gentry在2009年博士论文中首次提出数字领域的第一个全同态加密(Fully Homomorphic Encryption,FHE)方案。
同态加密解决了数据计算与数据所属主体不一致造成的隐私安全问题。因此,该技术能够应用在所有计算服务和数据所属主体不一致的场景中,例如:云计算的外包服务、人工智能的训练与推理、区块链的去中心化、物联网的数据采集与处理、政治投票与选举等。以下重点介绍同态加密在深度学习和区块链中的应用及其作用。
深度学习作为人工智能领域的重要研究和应用方向,近年来在算法、数据和算力三大引擎的驱动下得到飞速发展。数据作为AI的重要驱动力之一,隐私和安全也就成为一项关键挑战,其中包括训练数据安全、推理数据隐私以及模型应用保密。很多公司都在出售标记数据,但是这些数据被AI算法公司买去以后做什么用几乎没法控制。今年6月,微软删除了全球规模最大的人脸识别数据库MS Celeb,一个直接原因就是无法控制数据的使用。
现在AI正处于起步阶段,未来随着AI产业分工的不断细化,在AI应用过程中保护数据安全和数据隐私也将成为一个普遍性的行业问题。显然同态加密技术非常适合解决这一问题,同态加密技术可以在密文状态下执行深度学习神经网络的模型训练、数据推理和保密应用,AI将是同态加密的一个热点应用领域。
区块链被作为我国核心技术自主创新的重要突破口,正在金融、供应链、公共安全、物联网等领域发挥着越来越重要的作用。金融领域的区块链+支付(国际清结算)、区块链+保险理赔、区块链+交易所、区块链+数字资产等应用使得价值交互过程中人与人之间的信任关系能够转换为人与技术的信任。然而,区块链在应用过程中的信任尚不完整,尤其缺乏对用户隐私的保护。例如,区块链+支付应用中,验证交易有效性的同时会造成交易数据、交易账户(或匿名账户)等内容的泄露。因此,区块链应用中存在有效性验证与数据隐私保护之间的矛盾。而同态加密的应用就能够提供隐私保护的区块链实现方法,在保证区块链有效性得到验证的同时实现区块链数据的隐私保护。
浪潮对于同态加密的研究和应用
作为未来最具潜力的数据隐私保护解决方案,在同态加密的应用和理论研究过程中,浪潮在努力为其发展和成熟贡献自己的力量。
应用研究方面,浪潮对当前各个同态加密的开源实现进行了跟踪和研究,包括IBM的HElib和Microsoft的SEAL同态计算实现。目前,同态加密的应用面临两个关键瓶颈问题:一是复杂度高、计算效率低,二是可支持的同态计算操作少。正是由于同态加密技术在计算复杂性与同态安全性上的特点,吸引了越来越多的力量投入到其应用的探索研究中。另外,在隐私保护的深度学习领域浪潮重点跟踪Intel提出的nGraph HE-Transformer:利用Microsoft的SEAL作为后端基础技术,实现前端不同深度学习框架对同态加密计算的无缝调用,以保护人工智能应用中的数据隐私。然而,在研究过程中发现,隐私保护的深度学习技术距离真正的商用还有很长的路要走,最为关键的就是在推理阶段的计算延时达几分钟之久。因此,浪潮现阶段正在致力于研究利用异构加速平台提高 HE-Transformer的计算效率,以达到可以接受的计算和响应延时。
理论研究方面,浪潮一直关注国际最前沿的密码学和信息安全发展,跟踪各大顶级会议(例如Crypto、EuroCrypto、AsiaCrypto以及CF等)最先进同态加密的研究进展。同时,浪潮也在紧密联系国内各大高校的研究团队(例如密码科学技术国家重点实验室、中科院信工所、浙江万里学院、北京邮电大学、电子科技大学等),争取更多的合作机会为同态加密在国内的发展、实现和标准化做出自己的贡献。此外,浪潮也在践行自己的科研使命,力争在已有方法的基础上,开拓新的研究思路,突破旧的应用瓶颈,例如:针对深度学习图像识别和分类应用中的数据特征,设计和实现既能满足其安全和精度要求,又能保证性能的新方法和新技术。
展望
现在,正处于IT技术和应用的变革期,云、大数据、人工智能等技术的发展让人类社会从信息化向智能化升级,数据作为当今信息化和未来智能化时代的关键生产资料已经成为个人、组织和国家的重要经济资产和核心战略资本。当前,保护数据的隐私和安全已经成为全社会亟需且亟待解决的重要问题,因此同态加密的瓶颈一旦被突破,一定会拥有广阔的前景!