首页 > 其他分享 >隐私计算之浅谈联邦学习

隐私计算之浅谈联邦学习

时间:2023-08-10 17:33:05浏览次数:57  
标签:浅谈 模型 学习 隐私 联邦 数据

本文分享自天翼云开发者社区《隐私计算之浅谈联邦学习》 作者:l****n

一、背景

“数据孤岛”简单的讲,各组织都持有各自的数据,这些数据之间互有关系但又独立存储于各组织。出于安全性、合规性等方面考虑,各组织只能查询、使用己方数据,无法交换其它组织的数据。在联邦学习出现前,针对数据隐私保护的密码学已应用于本地数据机器学习,随着“数据孤岛”问题的浮现,联邦学习的概念出现并发展的日益成熟。

二、联邦学习的概念

联邦学习的术语最早是McMahan等提出的,即“我们把我们的方法称为联邦学习,因为学习任务是由一个松散的联邦参与设备(我们称之为客户端)来解决的,而这个联邦设备是由一个中央服务器来协调的”。在比较权威的论文中有关于它的进一步定义便于我们理解:

联邦学习是一种机器学习设置,在中央服务器或服务提供商的协调下,多个实体(客户端)协作解决机器学习问题。每个客户的原始数据都存储在本地,不进行交换和传输;作为替代,通过特定的中间运算结果的传输和聚合来达到机器学习模型训练的目标。

而根据数据的分布形式,联邦学习可以分为三种:纵向联邦学习、横向联邦学习和迁移学习。纵向联邦限定各个联邦成员提供的数据集样本有足够大的交集,特征具有互补性,模型参数分别存放于对应的联邦成员内,并通过联邦梯度下降等技术进行优化。横向联邦限定各个联邦成员提供的数据集特征含义相同、模型参数结构相同,并使用联邦平均等隐私保护技术生成联邦模型。迁移学习既不限定数据集的特征含义相同,也不需要样本有交集,是一种在相似任务上传播知识的方法。

三、解决“数据孤岛”问题的难点与联邦学习的优势

难点:

1、数据安全保护。将不同组织的数据共享,除了数据泄露问题,还要考虑数据投毒攻/击等。

2、数据传输速度与成本。

3、数据定价难。

优势:

1、安全性:通过引入密码算法和其它多方安全计算方案,保证了在多方交互过程中只用到交集部分,差集部分不会出现数据泄露。

2、无损性:采用的同态加密技术保证了各方原始数据不会被传输,且加密的数据具有可计算性。

3、公平性:保证了参与方的公平性,让各参与方在数据独立的条件下建立联合训练模型。

标签:浅谈,模型,学习,隐私,联邦,数据
From: https://www.cnblogs.com/developer-tianyiyun/p/17621001.html

相关文章

  • 浅谈根号分治
    浅谈根号分治一、问题引入  给定一个长度为\(n\)的序列,进行\(m\)次询问。每次询问给出两个数字\(x,y\)。对于每次询问,输出所有下标模除\(x\)等于\(y\)的元素的总和。  对于这个问题,我们发现他要维护的是一段离散的元素的和,而我们平时学的数据结构,如线段树等都只能维护一段......
  • 浅谈弧光保护在中低压开关柜中的应用
    未晓妃安科瑞电气股份有限公司上海嘉定201801摘要:近年来,中低压开关柜的使用越来越普遍。在此过程中,确保开关柜平稳运行至关重要。并在此基础上,阐述了由此产生的弧光和电弧事故的危险性,引入弧光保护及母线保护的特点必要性分析,阐述了弧光保护系统的原理和结构。工程实例证明,弧光保......
  • CGAL入门——浅谈CGAL
    CGAL官网https://doc.cgal.org/latest/Manual/index.html最近在学习CGAL,发现CGAL中文资料太少了,官网示例代码也很少注释,还加入了很多自定义的很少见过的名词,易读性略差,学习起来有点难度赶紧记录一下学习过程,怕以后忘了 1.简介CGAL(ComputationalGeometryAlgorithmsLibrar......
  • 浅谈项目架构设计
    整理自b站up主主要一点是最合适的是最好的,不必为了过于追求某项技术而冗余!一.功能性需求1.跟实际的业务需求是对应的!2.所使用的技术框架是不是够先进,文档是否完善,使用过程中容易排查到问题3.技术是否为开源的,够不够活跃,更新频率等4.成本:学习成本,使用成本,迁移成本,维护成本,要......
  • 浅谈AI浪潮下的视频大数据发展趋势与应用
    视频大数据的发展趋势是多样化和个性化的。随着科技的不断进步,人们对于视频内容的需求也在不断变化。从传统的电视节目到现在的短视频、直播、VR等多种形式,视频内容已经不再是单一的娱乐方式,更是涉及到教育、医疗、商业等各个领域。为了满足用户个性化的需求,视频大数据的分析和挖掘......
  • 联邦学习
    目录基础知识(个人笔记)SDN/NFVECA/ECN/ECI下行与上行网络带宽云计算边缘计算增量学习迁移学习CollaborativeEdgeComputing边缘计算的关键挑战模型的收敛速度数据非独立同分布为什么会导致准确性下降和收敛速度变慢?纵向联邦学习和横向联邦学习StragglerproblemSingle-process......
  • 浅谈 2-SAT
    SAT是适定性(Satisfiability)问题的简称。一般形式为k-适定性问题,简称k-SAT。而当\(k>2\)时该问题为NP完全的。所以我们只研究\(k=2\)的情况。而2-SAT问题一般指的是,有\(n\)个布尔变量\(x_1,x_2\dotsx_n\),现在有若干个二元的运算,是对于\(x_i,\negx_i,x_j\neg......
  • 浅谈PLC程序命名3大通用规则
    导读工程师在编写PLC程序时,可能需要对项目中的程序块、变量表、单一背景数据块、全局DB块等命名。在博途软件中支持中文和英文的命名。但是一旦程序量比较大,命名可能就会出现混乱的现象。针对命名,只要读者遵循相关命名规则就不易发生混乱。本文以博途软件为例进行探讨。01......
  • 浅谈伯努利数
    O.前言在翻洛谷日报的时候居然没看到伯努利数的讲解,于是有了这篇文章。想要看懂本文,你需要提前知道以下内容:二项式系数;幂级数;艾弗森括号;下降幂;第二类斯特林数。部分内容在文中给了对应的公式,故不放在前言内。I.伯努利数的定义:万恶之源\(m\)次幂的求和公式1.伯努......
  • 浅谈如何给.net程序加多层壳达到1+1>2的效果
    合集-.net代码混淆加密产权保护(3) 1.记一次.net加密神器Eazfuscator.NET2023.2最新版使用尝试06-272.将SmartAssembly与单文件可执行文件一起使用(.NETCore6)06-273.【干货】浅谈如何给.net程序加多层壳达到1+1>2的效果08-05收起 软件破解分白盒和......