首页 > 其他分享 >【五期李伟平】CCF-A(TMC'22)Enabling Long-Term Cooperation in Cross-Silo Federated Learning: A Repeated

【五期李伟平】CCF-A(TMC'22)Enabling Long-Term Cooperation in Cross-Silo Federated Learning: A Repeated

时间:2023-12-27 21:01:27浏览次数:32  
标签:Term 博弈 Learning 22 重复 Enabling 数据量 时隙

Zhang, Ning , Q. Ma , and X. Chen . "Enabling Long-Term Cooperation in Cross-Silo Federated Learning: A Repeated Game Perspective." (2022).

   针对重复执行跨筒仓联邦学习过程中如何保持客户积极参与(增加训练时使用的数据量、减少搭便车行为),本文提出合作的、子博弈完美纳什均衡(SPNE)的无限重复博弈。本文模型将无限时间划分为一个个时隙,一个时隙进行一次子博弈,时隙的具体划分有更具体的场景决定(例如银行的一个月或医院的一周)。客户端的成本包括1模型精度损失2计算3通信4服务端服务费。本文首先提出一个单阶段的博弈,分析博弈均衡;随后基于单阶段博弈计算重复博弈,得到重复博弈条件下单阶段博弈的均衡;最后通过添加一种惩罚机制,实现子博弈完美均衡的重复博弈。

   从论文写作上,方案从单阶段博弈到重复博弈再到子博弈完美,层层推进,思路明确。

   默认客户端诚实上报自己的各种信息,没有考虑错误报告的情况。假定各客户端持有数据量相同,且该数据量参数在推导过程中比较重要。

2023年12月27日


标签:Term,博弈,Learning,22,重复,Enabling,数据量,时隙
From: https://www.cnblogs.com/FBprivacy/p/17931412.html

相关文章

  • 代码随想录算法训练营第十五天 | 层序遍历 ,226.翻转二叉树,101.对称二叉树
    一、二叉树层序遍历题目链接:LeetCode102.二叉树的层序遍历LeetCode107.二叉树的层序遍历IILeetCode199.二叉树的右视图LeetCode637.二叉树的层平均值LeetCode429.N叉树的层序遍历LeetCode515.在每个树行中找最大值LeetCode116.填充每个节点的下一个右侧节......
  • 11 ADC模块FEP-DAQ422X采集显示波形方案
    软件版本:VIVADO2021.1操作系统:WIN1064bit硬件平台:适用XILINXA7/K7/Z7/ZU/KU系列FPGA登录米联客(MiLianKe)FPGA社区-www.uisrc.com观看免费视频课程、在线答疑解惑!1概述本方案通过把DAQ422X采集到的数据,通过前面已经完成的示波器显示驱动进行在屏幕上显示ADC采集的波形数据......
  • 222
    importargparseimportloggingimportos.pathimportsysimporttimefromcollectionsimportOrderedDictimporttorchvision.utilsastvutilsimportnumpyasnpimporttorchfromIPythonimportembedimportlpipsfromtorchvisionimportutilsasvutilsi......
  • 测试开发 | 人工智能无监督学习(Unsupervised Learning)
    无监督学习是人工智能领域中备受关注的学习方式之一,其独特之处在于不依赖标签数据进行训练。本文将深入介绍无监督学习的定义、原理、应用领域以及未来发展趋势。1.无监督学习的定义无监督学习是一种机器学习范式,其目标是从未标记的数据中发现模式、结构和规律,而不像监督学习那样......
  • 测试开发 | 人工智能强化学习(Reinforcement Learning)
    人工智能强化学习(ReinforcementLearning,简称RL)是一种令人兴奋的学习范式,它通过智能体与环境的交互,通过尝试和错误来学习最佳决策策略。本文将深入探讨强化学习的定义、核心原理、典型应用以及未来发展趋势。1.强化学习的定义强化学习是一种通过智能体与环境的交互学习的范式,其目......
  • 拓端tecdat获评“商业新知 2022 年度IT研发十佳创作者”
    近日,商业新知平台隆重推出了“新知之星——2022年度优秀创作者评选”活动,以此感恩那些为用户带来丰富商业知识的创作者们。在这次评选活动中,国内数据服务提供商拓端tecdat荣获了“商业新知2022年度IT研发十佳创作者”的称号。拓端tecdat成立于2016年,专注于为客户提供专业的数......
  • P9032 [COCI2022-2023#1] Neboderi 题解
    P9032考试题。发现\(g\)的值是若干个相同的段,且段数很少,因为每次取\(\gcd\)至少会将值域变为原来的一半。所以段数是\(\mathcal{O}(\logV)\)的。然后就可以从小到大枚举左端点,然后枚举\(g\)的值,找的是最远的满足\(\gcd(a_l,\dots,a_r)=g\)的\(r\),这里可以使用二分......
  • Neural Networks for Weather Prediction: Enhancing Accuracy with Deep Learning
    1.背景介绍气象预报是一项对于人类生活和经济发展至关重要的科学。传统的气象预报方法主要包括观测、数据处理、数值预报和预报分析等。随着计算能力和数据量的增加,人工智能技术,尤其是深度学习,在气象预报中发挥了越来越重要的作用。在这篇文章中,我们将介绍如何使用神经网络来预测气......
  • Azure Machine Learning的API和SDK:实现高效开发
    1.背景介绍AzureMachineLearning是一个云端服务,可以帮助数据科学家和机器学习工程师更快地构建、训练和部署机器学习模型。它提供了一套可扩展的工具和API,以便开发人员可以轻松地将机器学习功能集成到其他应用程序中。在本文中,我们将深入了解AzureMachineLearning的API和SDK,以......
  • Reinforcement Learning in Energy Management: Optimizing Grid Operations and Redu
    1.背景介绍Reinforcementlearning(RL)isasubfieldofmachinelearningthatfocusesonhowagentsoughttotakeactionsinanenvironmentinordertomaximizesomenotionofcumulativereward.Inrecentyears,reinforcementlearninghasbeenappliedtoawid......