首页 > 其他分享 >隐私计算和大模型

隐私计算和大模型

时间:2023-12-19 23:23:07浏览次数:30  
标签:嵌入 模型 水印 隐私 计算 黑盒

来源:象话时刻 | 微众银行杨强:大模型的崛起是隐私计算发展的绝佳机会

观点

  • 大模型的崛起,是隐私计算再次发展的绝佳机会。行业已经证明了用隐私计算做大模型的“防火墙”是可行的,全世界范围内大家也已经开始认识到这个方向;(效率又是一大难关)

  • 数据要素流通最关键的是模型,以模型为中心,而不是以数据为中心。因为模型与场景强相关,相比数据价值,模型价值更易评估,数据交易所更确切的说应该叫模型交易所,未来模型定价、模型tracking、数据的二次变现能够更容易的成为事实;

  • 大模型会导致算力、数据、场景的供需矛盾会更突出,带来更大的分布式需求,这也会对隐私计算提出新的要求;大模型很难独立产生商业价值,联邦大模型是突破点;

  • 我们处在这个时代非常的幸运,无论是联邦学习、隐私计算还是MPC,我们有非常庞大的工具箱,战友们为我们做好了准备,现在需要我们发挥聪明才智把这些积累组合成可用的系统;

  • 之前我们有两个范式,其一是ToC模式的横向联邦学习,其二是ToB模式的纵向联邦学习。现在我们总结出了第三种范式,即联邦大模型范式。这个范式一旦成立,将大大缓解行业在实践中的众多本地需求;

  • 很多人会错误的认为模型性能、隐私保护、算法效率可以同时达到100%。虽然这实际上是一个不可能三角,但是我们只要聪明的运用领域知识,我们就可以把这三方面平衡的非常好。同时,这不是一个单一的技术问题,我们在某些时候可以把优化的任务交给法律来实现;(法律规定了隐私保护范围,技术决定了算法效率和模型性能

  • 联邦学习是隐私计算和AI的交集,是一种分布式AI的隐私计算解决方案,一方面是模型的概念,一方面要运用各种各样的隐私计算的工具箱;

  • 可信联邦学习需要是可信的、可解释的、可跟踪的,这些都可以变成数学上的目标,变成标准的数学框架;

  • 可信、高效是行业对隐私计算的基本要求;可信、高效的平衡,既是一个学术问题,也是一个商业问题。(可信是目标,高效是难点)

探索

白盒水印、黑盒水印两种模型知识产权的保护手段。通过在模型中嵌入水印,一方面保证模型性能不受影响,另一方面需要的时候能够可靠地提取水印进行验证,实现对模型知识产权的确认和保护。

参考:https://zhuanlan.zhihu.com/p/545282063

神经网络水印是当前DNN模型版权保护方法,分为

  • 白盒水印

模型所有者在目标模型的内部嵌入水印。不足之处是提取水印时,目标模型的网络结构和内部权重等信息都是已知的,优点是不损失精度。

img

  • 黑盒水印

模型所有者不知道目标模型的内部结构和权重,只能通过API来访问目标模型,通常是构造触发数据集(用于实现特定输出的样本及)来验证版权。

由于修改了模型训练数据集,必然会影响模型的准确率。

img

  • 灰盒水印

结合了黑盒和白盒水印的特点,但并未有明显优势,所有使用较少。

既通过向模型的内部嵌入信息,又以黑盒的方式获取输出以验证模型版权。

与黑盒水印的嵌入不同,灰盒水印则是在模型内部嵌入信息实现在模型中嵌入水印(白盒思路)。

img

  • 无盒水印

无盒水印区别于另外三种,模型版权验证即不需要在模型内部嵌入水印也不需要构建特定的输入输出对(触发数据集),也不需要模型本身参与。

输入的图像经过模型,输出后会携带水印信息,通过提取输出图像中的水印信息即可验证模型版权。

无盒水印主要应用于图像处理的DNN模型。

img

标签:嵌入,模型,水印,隐私,计算,黑盒
From: https://www.cnblogs.com/pam-sh/p/17915099.html

相关文章

  • (大模型训练)(工作流升级)(精品)MJ数据自动化处理流程!!!
     0.准备条件:文件夹为中文名,图片内含有多个下划线。  处理目标:处理成为一个  “公共标|逗号|一个句子"的形式。1.(统计中文,准备翻译)文件夹结构作为数据统计入excelimportosimportpandasaspddeffind_image_folders(parent_directory):"""遍历父目......
  • html的文档对象模型的基础操作
    可以理解为前端html中的节点,整个html页面由各种各样的文档对象模型组成本文中简单介绍文档对象模型的基础操作1.获取元素//通过ID获取元素letheaderElement=document.getElementById('header');//通过类名获取元素集合letparagraphs=document.getElementsByClassName(......
  • 算法学习笔记(8.3): 网络最大流 - 模型篇
    本文慢慢整理部分模型。DAG最小路径覆盖经典的题目,经典的思想。网络流常见的将图上的点拆为入点和出点,那么路径由若干出-入-出-入的循环构成。于是在拆好的图上流一流即可。[CTSC2008]祭祀典中祭黑白染色利用黑白染色将整个图变成一个二分图是网络流常见的套路,......
  • 大数据 云计算
     包邮正品‖决战大数据:驾驭未来商业的利器车品觉数据之巅 [交易快照]¥45.901申请售后投诉卖家¥21.00(含运费:¥0.00) 交易成功订单详情双方已评 包邮正品‖2013中国好书大数据时代:生活、工作与思维的大变革 [交易快......
  • 目标检测算法中的AP以及mAP值的计算
    mAP的是各个类别的AP的值的平均值#https://blog.csdn.net/qq_36523492/article/details/108469465计算方法选择第二种方法theinterpolationperformedinallpoints#定义一个列表lst=[3,1,4,2]#使用sorted函数对列表进行排序,并获取原始元素在排序后列表中的索......
  • 分类模型
    分类模型二分类模型对于二分类模型,介绍逻辑回归(logisticregression)和Fisher线性判别分析两种分类算法;对于多分类模型,将简单介绍Spss中的多分类线性判别分析和多分类逻辑回归的操作步骤水果分类例子这个实际上就是一个二分类问题,通过属性推断类别。逻辑回归logisticreg......
  • R语言群组变量选择、组惩罚group lasso套索模型预测分析新生儿出生体重风险因素数据和
    原文链接:http://tecdat.cn/?p=25158原文出处:拓端数据部落公众号 本文拟合具有分组惩罚的线性回归、GLM和Cox回归模型的正则化路径。这包括组选择方法,如组lasso套索、组MCP和组SCAD,以及双级选择方法,如组指数lasso、组MCP。还提供了进行交叉验证以及拟合后可视化、总结和预测的实......
  • opencv图像处理机器学习真实项目教程(python实现)1计算机视觉简介
    1计算机视觉简介欢迎来到计算机视觉的世界。本书将带您踏上令人兴奋且快速发展的计算机视觉和图像处理世界的旅程。本书首先介绍计算机视觉和OpenCV库。然后,我们将继续介绍本课程的基本库和所需的环境设置。主要内容:计算机视觉简介计算机视觉的应用PythonOpenCVOpenCV......
  • 高等数值分析(高性能计算,并行计算) (Parallel and High Performance Computing)
    https://github.com/OpenMPhttps://math.ecnu.edu.cn/~jypan/Teaching/ParaComp/ParallelandHighPerformanceComputing(高等数值分析(高性能计算,并行计算))基本信息:教材:本课程主要讲授数值并行计算,内容以课堂讲义为主主要参考资料:并行计算与实现技术,迟学斌等,科学出版社,20......
  • 阿里-可视化建模-评估模型
    登录PAI控制台,进入工作流页面。操作详情请参见step1:进入工作流页面。构建预测节点。在组件列表中分别搜索预测组件,找到后将其拖入画布,并将生成的节点作为拆分-1、逻辑回归二分类-1节点的下游节点,拼接为实验。单击画布中的预测-1节点,在右侧节点配置中,分别单击特征列字段、......