首页 > 其他分享 >【一周聚焦】联邦学习 10.9-10.16

【一周聚焦】联邦学习 10.9-10.16

时间:2023-11-21 17:02:23浏览次数:25  
标签:Learning 训练 10.9 聚焦 Language LLM FL 模型 10.16

近期的联邦学习做了如下内容:

大模型

目前大模型是绝对的研究风口,而FL中为了降低传输开销的网络压缩技术也是可以服务于LLM的高效传输的。

港科大+微众银行,10月16,FATE-LLM: A Industrial Grade Federated Learning Framework for Large Language Models

杨强团队一直在推FATE这个联邦学习框架,现在踩着大模型的风口在做基于微调的大模型。唯一的亮点就是各种常见方法真的集成得很全面,包括communication-efficient,LLM模型及训练方法、privacy部分都有照顾到,是比较大的工作量。
Alt text

当然整个实验还是处于比较初级的阶段,比如实验上,只有2个用户参与联邦学习,FL的迭代轮次也只有5次。这导致训练效果只比单独用户用本地训练好一些,比不过数据集中式的训练。

这个方向比较大的问题还是在于当前数据分配情况是否满足需求。本地的计算能力如果不足的话可以用云计算来代替,甚至在云上汇总。但是对于不同用户上相差极大的数据,LLM的鲁棒性是否真的够用,是需要进一步看的。

IBM,10月13日,A Comparative Analysis of Task-Agnostic Distillation Methods for Compressing Transformer Language Models

其实这个不完全属于FL,主要对比了在大模型做知识提取的时候,不同方法的效果如何。
Alt text

Bosch AI中心,10月9日,TEXT-DRIVEN PROMPT GENERATION FOR VISION-LANGUAGE MODELS IN FEDERATED LEARNING

这种应该是FL+LLM的比较正确的研究思路,而不仅仅是应用。逐渐聚焦的思路是,Visual-Language Model Prompt Learning→Federated Learning with Visual-Language Models

Prompt learning的含义:找到合适的prompt来指导大模型的训练。
为什么要有prompt:用于解决训练样本不足的问题,相当于在LLM的训练过程中就把目标任务囊括进去了。比如要做句子的分类问题,可以直接用监督学习来做,但是需要大量的标签样本。需要大量的样本的一个原因是,训练的时候用了mask作为token进行预训练,但是下游任务并没有这个token,导致需要大量数据来填平这个gap。那如果能在下游任务中引入mask这个token就好了,而通过prompt来实现就是一种方法。通过设计prompt,将需要判决的标签作为预训练时mask的内容,这样就能在训练过程中学到判决的知识。

个性化

西电,10月13,PAGE: Equilibrate Personalization and Generalization in
Federated Learning

将用户个性化与服务器泛化性的博弈建模为MDP问题,用强化学习求解,学习准确度从 35.20%提升到了39.91%。实验用的还是大模型与大数据集。

标签:Learning,训练,10.9,聚焦,Language,LLM,FL,模型,10.16
From: https://www.cnblogs.com/mhlan/p/17846964.html

相关文章

  • SonarQube系列-通过配置扫描分析范围,聚焦关键问题
    在许多情况下,你可能不希望分析项目中每个源文件的各个方面。例如,项目可能包含生成的代码、库中的源代码或有意复制的代码。在这种情况下,跳过这些文件分析的部分或全部方面是有意义的,从而消除干扰并将焦点缩小到真正重要的问题上。如果SonarQube的结果不相关,那么没有人会想要使用它......
  • 海康机器人:聚焦三大视觉技术,精准赋能智能制造
    智能智造生态领域因有科技加持,更新速度较为迅速,也正是因为更新速度的持续加快,为各行各业提供了便捷、高效发展的机会。海康机器人作为行业知名企业,就为各行业提供了多样的智能设备。在2D视觉领域,海康机器人推出了多款用于检测的设备。其中,8k黑白高速线阵相机和16k真彩色线......
  • 聚焦能源发展,推动绿色生态|海康机器人以品质产品助力
    如今,低碳发展备受关注,各品牌想要取得长远的发展,离不开对低碳的践行。海康机器人作为智能制造企业,在打造自动化设备的过程中,也关注到了低碳发展的优势,并且依托两大产品线——AMR及机器视觉,针对新能源各细分场景特点,打造了系列解决方案。在光伏产业领域,相关数据显示,全球光伏......
  • vue指令实现input自动聚焦
    vue指令实现自动聚焦代码如下:AutoFocus.jsimportVuefrom'vue'//插件对象(必须有install方法,才可以注入到Vue.use中)exportdefault{install(){Vue.directive('fofo',{inserted(el){fn(el)},update(el){fn(el)......
  • 10.16
    编写一个方法,使用以上算法生成指定数目(比如1000个)的随机整数。源代码:importjava.util.Scanner;importjava.util.Random;publicclassMain{publicstaticvoidmain(String[]args){Scannersin=newScanner(System.in);System.out.println("请输入想......
  • 和鲸为神经计算建模及编程培训班提供支持,聚焦学术前沿,助力人才培养
    探索与求知,培养与传承。让青年人更早地触摸到科学研究的前沿,便能吸引更多人才投身于学科建设。11月4日,由北京大学信息处理实验室开展进行,北京大学心理与认知科学学院院长吴思教授及课题组成员授课的第二届神经计算建模及编程培训班将再度开课。课程以北京大学神经信息处理课题组所......
  • 大二快乐日记10.16
    2.配置多个<url-pattern>子元素从Servlet2.5开始,<servlet-mapping>元素可以包含多个<url-pattern>子元素,每个<url-pattern>代表一个虚拟路径的映射规则。因此,通过在一个<servlet-mapping>元素中配置多个<url-pattern>子元素,也可以实现Servlet的多重映射。以ser......
  • 大二快乐日记10.9
    在MySQL中,可使用SHOWDATABASES语句来查看或显示当前用户权限范围以内的数据库。查看数据库的语法格式为:纯文本复制SHOWDATABASES[LIKE'数据库名'];实例1:查看所有数据库列出当前用户可查看的所有数据库:mysql>SHOWDATABASES;+--------------------+|Database......
  • 产学研融合聚焦技术难点,2023年度“CCF-蚂蚁绿色计算&隐私计算专项科研基金”正式发布
    10月26日,第二十届中国计算机大会(CNCC2023)于沈阳举行,以“发展数字基础设施,支撑数字中国建设”为主题,邀请产业界及学术界各方代表参会并开展分享与交流。大会期间,2023年度CCF-蚂蚁绿色计算专项科研基金与CCF-蚂蚁隐私计算专项科研基金于蚂蚁集团主办的“CCF-蚂蚁科研基金及产学研合......
  • 为什么激光共聚焦显微镜成像质量更好?
    激光共聚焦显微镜原理是由LED光源发出的光束经过一个多孔盘和物镜后,聚焦到样品表面。之后光束经样品表面反射回测量系统。再次通过MPD上的针孔时,反射光将只保留聚焦的光点。最后,光束经分光片反射后在相机上成像。为什么激光共聚焦显微镜成像质量更好?1、激光共聚焦显微镜采用了激......