为了结合隐私计算技术和AI技术,Lattice X基金会推出了Rosetta开源框架项目
Rosetta
出发点
解决AI算法数据需求与隐私保护之间的矛盾问题:
- AI算法需要的数据越多,一般情况该算法的效果就会越好
- 隐私保护的需求则是暴露的数据越少越好
- Rosetta 目标结合隐私计算、区块链和AI三种典型技术以支撑完备的隐私AI解决方案。
- 可部署、可运维、可运营的商用产品为最终目的。
- 打破基于密码学的隐私计算技术与机器学习深度学习计算及框架之间的技术壁垒
Rosetta三大优势:
易用性
- 丰富的基础隐私算子和数据处理接口l
- 自动算子转换
- 支持密文算子的自动反向求导
高效性
- 兼容Tensorflow自身对于图动态执行时的各种并行优化
- 保持底层算法的C/C++实现
- 定制化改造前沿密码学MPC协议
灵活性(可扩展性)
- 可快速集成新的MPC协议
- 支持模型保存形式、安全协议精度等可配置化
- 支持安全协议中使用自定义格式密文格式
Rosetta架构图
Rosetta核心
- 以商业为主要目的,支持主流的AI框架,以TensorFlow为主
- 以AI工程师为目标人群,可以快速无门槛的从传统模式切换到隐私计算的模式
- 支持多种隐私计算技术,保持算法性能,并可按序进行配置
隐私计算技术说明
隐私计算是保证数据在使用和融合过程中隐私的综合性技术
隐私计算技术类型 | 具体技术 |
---|---|
基于算法 | - 密码学 -安全多方计算 - 零知识证明 - 同态加密 - 联邦学习 |
基于硬件 | - 可信执行环境 -Intel的SGX -ARM的TrustZone -KeyStone |
AI面临的数据隐私痛点
数据多样性
- 多样化的数据提升模型精度
- 数据归集到本地进行训练
数据隐私性
- 数据作为核心资产不能明文共享
- 数据共享后价值降低
Rosetta 基本用法
- 引入rosetta包,先择一个MPC算法
- 处理私有数据
- 完全复用TensorFlow接口