数据要素只有在安全、高效的流通中才能充分发挥价值。过去,数据持有方出于数据安全、隐私保护等考虑,导致“数据高墙”林立。现在,隐私计算的兴起正令这一局面发生改变,可信联邦学习应运而生。

隐私计算是一种由两个或多个参与方联合计算的技术和系统。参与方在不泄露各自数据的前提下通过协作对数据进行联合机器学习和分析。隐私计算可实现“数据可用不可见”“数据不动模型动”,具备打破数据孤岛、加强隐私保护、强化数据安全合规性的能力,有望成为数据安全与隐私保护的“最优解”。

隐私计算开辟了数字时代的新蓝海。国家工业信息安全发展研究中心发布的《中国隐私计算产业发展报告(2020—2021)》显示,隐私计算产品市场规模约为10亿元,基于隐私计算的数据交易应用模式市场将达到千亿级。目前,隐私计算已在金融、医疗、交通等领域纷纷落地。

尽管隐私计算与联邦学习在数据安全上的优势得到了广泛认可,但在实际应用中却忽略了流通的高效性。如何兼顾安全与效率?在近日由中国信息通信研究院云计算与大数据研究所、清华大学智能产业研究院、深圳数据交易有限公司共同指导,FATE开源社区、开放群岛(OpenIslands)开源社区、智能投研技术联盟(ITL)联合主办的“联邦学习安全效率与开源生态”线上论坛上,众多业界专家、学者就此展开了充分讨论。

在安全与效率之间取得平衡,成为业界的关注点。加拿大皇家科学院及工程院两院院士、FATE开源社区技术指导委员会主席杨强指出:“理论研究结果显示安全和效能是存在的,但不可能有绝对的安全和绝对的效能;要同时提高效能与安全,就需要在二者间寻求一个平衡点。”香港科技大学智能网络与系统实验室主任、星云Clustar创始人陈凯教授认为,不解决算力和通信问题,隐私计算的大规模应用将无从谈起。

就安全而言,中国信息通信研究院云计算与大数据研究所大数据与区块链部副主任闫树认为,当前隐私计算安全要实现从理论研究安全到产品实现安全的跨越,必须经过算法安全、密码安全和产品安全三个标准的核验。未来,多技术融合是隐私计算安全性提升的一大趋势。

效率问题本质上是算力提升问题。FATE 开源社区TSC Maintainers成员、星云ClustarCTO张骏雪表示,从技术侧来看,要解决隐私计算的效率问题,需要结合具体企业、具体业务来进行具体分析,选择最适配的基础构建组件,而不是强行追求统一的方式。隐私计算可信联邦学习的未来是多技术、多方案融合并举的,要选择最可能落地的方案来提升效率。星云Clustar基于隐私计算算力体系布局,通过自研的硬件加速技术及产品,可以大幅提升数据共享的流通协作效率,为未来隐私计算的规模化应用打造算力“底座”,进而支撑起广泛的数据跨域流通网络。

能够消除数据壁垒的隐私计算,能够有效支撑数据要素市场化、全国数据资源流通“一盘棋”目标的实现,同时也将为“东数西算”工程增添“软”实力。

推荐内容