Client Selection in Federated Learning: Principles, Challenges, and Opportunities
一、摘要
大量的工作旨在解决FL训练的不同方面,如优化聚合方法[7],[8],增强隐私保护[9],[10]和改进鲁棒性[11]。
一个有效的FL客户端选择方案可以显著提高模型的准确性[16],增强公平性[24],增强鲁棒性[18],并减少训练开销[22]。
二、异质性 heterogeneity
2.1 系统的异构性
计算能力
通信能力
其他因素:如电池电量低、后台运行许多应用程序
2.2 统计异质性
大规模分布式数据,FL客户端的数量远远大于客户端的平均数据点数量。例如,一百万部智能手机参与了谷歌键盘查询建议项目[47],但一个用户通常每天最多只提出几十个查询
数据不平衡
非IID数据
三、效用
每轮根据客户端的“效用”排序客户端,选择效用最大的客户端
效应=统计效用*系统效用
3.1 统计效用:
3.1.1 基于数据样本的效用度量
基于数据样本的效用利用客户端的本地数据来量化统计效用
(1)根据数据集数量\(|D_i|\)
当每个数据样本具有相同的质量时,这种方法是有效的
(2)数据样本的重要性抽样
这个想法是给偏离模型很远的数据样本分配一个高重要性分数。
标签:样本,综述,FL,论文,异质性,效用,联邦,数据,客户端 From: https://www.cnblogs.com/FlyingLight/p/18349948