机器学习拜占庭容错方法: Bulyan

时间：2022-12-02 00:22:22浏览次数：68

论文链接：http://proceedings.mlr.press/v80/mhamdi18a/mhamdi18a.pdf

SGD存在问题

数据并行的SGD梯度聚合是所有梯度的线性组合，即：
\(F(G_1, ..., G_n) = \sum_{i=1}^n\lambda_iG_i\)
因此一个恶意的节点可以让全局模型朝着自己想的方向偏移（\(G_n\)为恶意节点的梯度）：
\(G_n = \dfrac{1}{\lambda_n}(U - \sum_{i=1}^{N-1}\lambda_iG_i)\)
如图所示：

由此，我们需要新的梯度聚合规则（GAR）

\((\alpha, f)\)-Byzatine Resilient GAR定义

\((\alpha, f)\)解释：包含\(f\)个拜占庭梯度；\(\alpha\)为角度
如果某算法为\((\alpha, f)\)-Byzatine Resilient算法，则满足以下规则：

输出的梯度为一个与正确的梯度\(g\)相差最多为\(\alpha\)的梯度
输出的梯度为被正确的梯度\(g\)的矩所约束的梯度

现有\((\alpha, f)\)-Byzatine Resilient GAR举例：Krum, Multi-Krum, Brute等。

Krum算法介绍

要求：n ≥ 2f + 3
算法步骤：

计算节点i的梯度与其余节点j（邻居节点）的梯度的距离（欧氏距离）
选取距离自己最近的n-f-2个梯度，然后将选取的梯度求和，作为节点i的得分score
得分最小的节点的梯度即为算法输出的梯度

Brute算法介绍

要求：n ≥ 2f + 1
算法步骤：

列出所有可能的簇（每个簇中包含n - f个节点）
找到最紧密相连的簇（该簇中距离最远的梯度是所有的簇中距离最近的）：
将找到的簇中的节点的梯度取平均

GARs缺陷

模型参数包含远大于1的维度，由此\(L_p\)范数较难辨别出以下两种恶意攻击：

每个维度上的微小变化
单一维度上的巨大变化
这样就较难收敛到一个较好的模型

Bulyan算法

要求：n ≥ 4f + 3

选出\(\theta\) = 2\(f\) + 3个梯度（根据Krum或Brute等算法选）
对梯度的每一维都选出\(\beta\) = \(\theta\) - 2\(f\) ≥ 3个值，这些值是距离每一维梯度的中位数最近的值
计算均值

结果

可以看出来在使用norm 2攻击的情况下，Bulyan准确率与没有攻击下的Average聚合算法的准确率大致相同。

Bulyan优点

相较于其它算法(Krum、GeoMed)代价较小，平均计算复杂度为\(O((n-2f)C+dn)\)
该算法可以在每个维度上工作，即可以识别出某一个变化很大的维度（克服了Krum算法的缺陷）。之所以可以工作在每一个维度上，是因为Bulyan结合了例如Trimbed Mean的算法，处理了每一个维度。

标签：梯度,算法,Krum,容错,Bulyan,拜占庭,维度,节点
From： https://www.cnblogs.com/luuumos/p/16937169.html

在低容错业务场景下落地微服务的实践经验
作者：禾连健康“健康体检是一个低容错的场景，用户到医院体检，由于IT原因导致无法完成预约的项目，会对用户体验造成极大的影响。”*——禾连健康CTO邓志豪禾连健康成......
[Json] GSON 数据容错
GSONGSON是Googel公司开发的用于解析json的类库。可以很轻松地让程序员将java对象转换成JSON格式，或者将JSON格式的对象转换成Java对象。GSON的github地址：https://github.......
微信小程序[ app.json 文件内容错误] app.json: app.json 未找到解决方法
导入项目后project.config.json文件被微信开发者工具修改，缺少代码：“miniprogramRoot”:"./dist"向project.config.json文件中添加如下代码“miniprogramRoot”:......
11 月亚马逊云科技培训与认证课程，精彩不容错过!
备考训练营：AmazonCertified云从业者2022年11月8日|10:00–11:30课程介绍：该课程无需您拥有特定的职业技能，您可以通过此课程获得对亚马逊云科技的全面了解，在该线上......
12-12-配置中心&服务容错设计实践课_ev
......
案例分享：Qt国产麒麟系统某防“某显示控制项目”（多类设备自动化流程控制，数据分析整合与
喜报我司承担的某防“某显示控制项目”，已于近日顺利通过湖底验收。<br>需求功能简介： 1.多类设备的显示、控制与管理 2.数据的分析与展示，定位图、深度图......
案例分享：Qt国产麒麟系统某防“某显示控制项目”（多类设备自动化流程控制，数据分析整合与
喜报我司承担的某防“某显示控制项目”，已于近日顺利通过湖底验收。需求功能简介： 1.多类设备的显示、控制与管理 2.数据的分析与展示，定位图、深......
可容错安全聚合算法学习笔记
目录参考文献安全聚合流程写在最前：在学习可容错安全聚合算法时，对其中的许多详细步骤不是特别清楚，遂将学习笔记记录下来，以作后期学习。若有不对请及时纠正。参考文献大......
不容错过！什么是领域驱动设计？为什么落地这么难？
引言领域驱动设计并不是新的架构设计理论，从EricEvans提出至今已经有十多年历史。由于微服务架构的兴起，DDD常用于指导微服务边界划分，并重新广泛进入软件研发大众的视野。D......

机器学习拜占庭容错方法: Bulyan

SGD存在问题

\((\alpha, f)\)-Byzatine Resilient GAR定义

Krum算法介绍

Brute算法介绍

GARs缺陷

Bulyan算法

结果

Bulyan优点

相关文章

赞助商

阅读排行

机器学习 拜占庭容错方法: Bulyan

SGD存在问题

\((\alpha, f)\)-Byzatine Resilient GAR定义

Krum算法介绍

Brute算法介绍

GARs缺陷

Bulyan算法

结果

Bulyan优点

相关文章

赞助商

阅读排行

机器学习拜占庭容错方法: Bulyan