【四期陶富强】CCF-A(AAAI 20)Federated learning for vision-and-language grounding problems.

时间：2022-10-12 21:25:13浏览次数：58

标签：模态 20 language 特征 grounding 图像 AAAI 文本客户端

[1] Liu F, Wu X, Ge S, et al. Federated learning for vision-and-language grounding problems[C]//Proceedings of the AAAI Conference on Artificial Intelligence. 2020, 34(07): 11572-11579.——CCF-A(AAAI）

这篇论文针对图像和文本的基础问题，如图像描述和视觉问答（VQA）。现有的一些方案提出的多模态框架有效融合了图像和文本的特征，优于单模态的方案。但是这些方案在共享所有下游任务数据的条件下进行训练的，这可能导致数据泄露。作者提出了一个联邦学习的框架，在不用共享数据的前提下，从不同的模态中获得各种类型的图像表征，然后将它们融合在一起，形成细粒度的图像表征，在防止数据泄漏的同时提高模型的性能。
这篇文章的优点在于，作者设计了对齐、集成和映射网络（aimNet），并实现了联邦学习框架，有效地将从图像提取出的视觉和文本特征转换成细粒度图像表征。对齐模块通过预训练模型提取的图像和文本特征使用交互注意力机制，来为图像提供了更清晰的语义表达。集成模块通过自我注意力机制整合图像和文本特征，捕捉突出图像区域之间的联系和文本单词之间的搭配，生成方面描述的图像表示。映射模块由两层非线性层组成，用于将对齐和集成模块学习到的细粒度图像表征映射到特定任务的特征域。总的来说，联邦学习框架如下：客户端通过预训练模型训练得到特征，上传到服务器，服务器利用aimNet网络对特征进行加工，得到新的特征再传回给客户端，客户端利用新的特征为输入传入本地模型做对应的任务，客户端再根据自己任务的评判指标去更新自己的模型参数，直到达到一个收敛的状态。
但这篇论文中对于场景的描述还不是很清晰，只是提到了数据泄露的问题。论文中提出的aimNet，本质上还是一个多模态学习框架，只是将他适配到联邦学习中，多模态与联邦学习结合的创新点和解决的问题难点没有体现出来。另外，虽然客户端共享的不是数据，在本地训练出图像的两种特征表达上传给服务器，这个过程并不能有效的保证客户端数据和隐私安全。如果这个客户端模型被获取到，或者是通过服务器发起的推理攻击就有可能得到输入原始的图像，就会造成客户端数据的泄露。

2022年10月12日

标签：模态,20,language,特征,grounding,图像,AAAI,文本,客户端
From： https://www.cnblogs.com/FBprivacy/p/16786051.html

Microsoft Visual Studio 2010 Service Pack 1 安装失败：系统无法找到指定的对象
MicrosoftVisualStudio2010ServicePack1安装失败：系统无法找到指定的对象vs2010学习版安装错误在此计算机中仅有部分MicrosoftVisualStudio2010产品已升级到Ser......
CVE-2022-22965漏洞分析
ASpringMVCorSpringWebFluxapplicationrunningonJDK9+maybevulnerabletoremotecodeexecution(RCE)viadatabinding.Thespecificexploitrequires......
2022.10.12
看了下自己的工资记录，上个月工资因为请假11小时扣了156，食堂消费22那应该一个月工资是2500，还比预想的多但是恐怕就没法拿满了，因为电器工程实践要花两周时间日子比想象的......
Ubuntu20.04降级安装gcc、g++6
编译cuda9.1的程序时需要使用gcc6、g++6，如果直接使用命令sudoapt-getinstallgcc-6g++-6-y安装，会出现以下错误：Packageg++-6isnotavailable,butisreferredtob......
Test 2022.10.12
今天是关机专场关于我好不容易写的题解因为关机而无了这件事T1理想的正方形本来写了挺多的，现在不想多说了，简单来说就是维护一个二维的单调队列一维单调队列就是对每......
2020版本idea version control 不见了解决办法
2020版本ideaversioncontrol不见了解决办法2020版本ideaversioncontrol不见了解决办法以前窗口底部是有个VersionControl的窗口的（如下图所示），但是现在没有了......
干货铺2021文章合集
2021年马上过去了，今年没写多少原创，一方面是因为忙，另外也没啥可写的。很多都写过了，所以更多是转载。明年，希望能坚持写下去吧。毕竟，已经写了这么多年：CSDN更新更少了……......
2022 CSP-S 游记
\(9.26\)：开坑。没报J组主要是因为J比较垃圾，去抢小朋友的一等没什么意思。初赛刚拿到试卷就直接懵了，这tm是给人做的题？宇宙射线是什么奇妙东西，还有基数排序我根本不......
老司机学swoole之基础进阶篇（进程篇）2019年swoole基础进阶之进程篇
0资料收集视频地址https://www.bilibili.com/video/BV1oJ411U7bc/?vd_source=4a69745b599dffec877b0fcfe130b0921设置自定义进程名称2创建第一个子进程、获取子进程......
初步解决manjaro下matlab2022a的simulink无法启动问题
0.、sudocd /usr/local/MATLAB/R2022a/cefclient/sys/os/glnxa64/&&sudomkdirexcludepwd/usr/local/MATLAB/R2022a/cefclient/sys/os/glnxa64/exclude/1......

【四期陶富强】CCF-A(AAAI 20)Federated learning for vision-and-language grounding problems.

相关文章

赞助商

阅读排行