MMFN论文阅读笔记（Multi-modal Fake News Detection on Social Media via Multi-grained Information Fusion）

时间：2024-02-26 10:35:18浏览次数：24

标签：模态 grained Multi CLIP 特征 boldsymbol MMFN 文本

论文标题：Multi-modal Fake News Detection on Social Media via Multi-grained Information Fusion
论文作者：Yangming Zhou, Yuzhou Yang, Qichao Ying, Zhenxing Qian, Xinpeng Zhang
论文来源：ICMR 2023，paper
论文代码：暂无

介绍

目前的多模态方法主要集中在文本和视觉特征的融合上，但未能有效地利用细粒度和粗粒度级别的多模态信息
由于模态之间缺乏相关性或每个模态所做的决策之间存在矛盾，它们受到歧义问题的困扰

该图展示了Weibo和Gossip数据集中的两个例子，展示了上述两个挑战。

上图描绘了多粒度假新闻检测的过程，其中文本和图像的单模态特征都无法验证真实性。人们会首先看到图片中的乞丐和骆驼，以及文本中的乞丐、乞讨、骆驼、截肢、膝盖、躺等文字。除了匹配的元素(标记为蓝色区域)，他们会发现截肢、膝盖和谎言这三个词与图像内容(标记为红色区域)不匹配。随后，他们会从整体上理解句子和图像的语义，进行分析，判断两者是否匹配，最终得出关于新闻真实性的结论。许多现有的工作往往忽略了这一点。

下面的图展示了一个模棱两可的例子。帖子中的视觉对象和文本实体没有显著的匹配关系，语义上是不相关的。人工审查可以很容易地判断这不太可能是假新闻，因为文本内容提供了事件的正式和详细的表达。然而，过度强调多模态融合的模型可能会因为多模态特征的不匹配而产生误判。

针对上述问题，本文提出了多粒度多模态融合网络(Multigrained Multi-modal Fusion Network, MMFN)。MMFN方法集成了单模态特征和多粒度多模态融合特征，用于更准确的假新闻检测。

贡献：

提出了MMFN，它实现了在不同粒度级别上处理多模态特征的思想，以形成反映新闻的详细和全局方面的综合表示
设计了两个单模态分支，并采用CLIP预训练模型来评估跨模态相关性，进一步解决高跨模态歧义场景带来的问题
在三个著名的数据集上进行了全面的实验，其中MMFN优于最先进的假新闻检测方法；消融研究验证了粒度级处理和多模态特征调整的有效性

方法

MMFN的网络设计如图所示，由多模态特征编码器(预训练的BERT对文本进行编码；Swin Transformer对图像进行编码)、多粒度特征融合、单模态分支和基于CLIP相似度的模态加权以及假新闻分类器组成。

多模态特征编码器

通过BERT对文本特征编码

新闻帖子的文本内容是由文本和图像中提取出的OCR的拼接，它是一个顺序的单词列表，表示为\(\left.\mathbf{T}=\left[\begin{matrix}{t_{1},t_{2},\ldots,t_{n_{w}}}\\\end{matrix}\right.\right]\)。
对文本应用BERT编码后，得到的文本特征为\(\mathbf{T}^{b}=\left[t_{1}^{b},t_{2}^{b},\ldots,t_{n_{w}}^{b}\right]\)，其中\(t_{i}^{b}\)是文本embedding中的第i个token的最后一个隐藏状态的输出，定义词embedding的维度为\(d_b\)。

通过Swin-T对图像特征编码

给定图像内容\(\mathbf{V}\in\mathbb{R}^{w\times h}\)，Swin-T将其转换为序列嵌入\(\mathbf{V^{s}}=\left[v_{1}^{s},v_{2}^{s},\ldots,v_{n_{p}}^{s}\right]\)，其中\(

标签：模态,grained,Multi,CLIP,特征,boldsymbol,MMFN,文本
From： https://www.cnblogs.com/cy-8516/p/18032921

MCN公司，即Multi-Channel Network
MCN公司MCN公司，即Multi-ChannelNetwork，是一种新型的数字内容营销和传播机构。它们通常专注于网络红人（KOL）的孵化、内容创作、分发和商业化。MCN公司通过签约和培养网络红人，利用这些红人的影响力在社交媒体、视频平台等渠道上推广品牌和产品。在中国，知名的MCN公......
AtCoder WTF 2019 B Multiple of Nine/南外集训 2024.2.23 T1
给定\(q\)个区间\(\{[l_i,r_i]\}\)，计算满足条件的长度为\(n\)的十进制数码串\(S\)的个数\(\bmod10^9+7\)：\(\foralli\in[1,q],num(S[l_i,r_i])\equiv0\pmod9\)。其中\(num(T)\)表示数码串\(T\)代表的整数，\(T[a,b]\)表示子串\(T_aT_{a+1}\dotsT_b\)......
[ARC104D] Multiset Mean
考虑计算和为\(x\)的方案时，把所有的数减去\(x\)，dp出和等于\(0\)的。减去后数被分为三段，小于\(0\)，等于\(0\)和大于\(0\)。其中等于\(0\)的直接乘上即可，对于正负，上下都是对称的，直接dp出\(f_{i,j}\)表示用了前\(i\)个数和为\(j\)的方案书，使用前缀和优化，最后......
map/multimap
map/multimap容器1.map/multimap也是关联式容器，容器自身有规则，通过键值排序，map容器中的元素是对组，对组的第一个元素是键值，不能改变，第二个元素是实值，可以改变2.数据结构：平衡二叉树3.迭代器：双向迭代器4.map容器和multimap容器的区别是multimap允许有相同的元素5.常用的api: ......
set/multiset
set/multiset容器Set的特性是。所有元素都会根据元素的键值自动被排序。Set的元素不像map那样可以同时拥有实值和键值，set的元素即是键值又是实值。Set不允许两个元素有相同的键值。我们可以通过set的迭代器改变set元素的值吗？不行，因为set元素值就是其键值，关系到set元素的排序规......
Multi-behavior Self-supervised Learning for Recommendation论文阅读笔记
Abstract本文提出了一个多行为自监督学习框架，以及一种自适应优化方法。具体而言，我们设计了一个行为感知的图神经网络，结合自注意力机制来捕捉行为的多样性和依赖关系。为了增强对目标行为下的数据稀疏性和辅助行为的嘈杂交互的鲁棒性，我们提出了一种新的自监督学习范式，以在行为间和......
SciTech-Mathmatics-Multiplication Properties
https://byjus.com/maths/multiplication/Inmathematics,multiplicationisamethodoffindingtheproductoftwoormorenumbers.Itisoneofthebasicarithmeticoperations,thatweuseineverydaylife.Themajorapplicationwecanseeinmultiplicatio......
Multi-behavior Recommendation with Graph Convolutional Networks论文阅读笔记
Abstract传统的推荐模型通常只是要一种类型的用户-项目交互，但是却有着严重的数据稀疏或者冷启动问题。使用多种类型的用户-项目交互的多行为推荐，如点击和收藏，可以作为一种有效的解决方案。早期队多行为推荐的努力未能捕捉到行为对目标行为的不同影响强度。它们还忽略了多行为数据......
Java中正则表达式(regex)匹配多行(Pattern.MULTILINE和Pattern.DOTALL模式)
Java中，正则表达式（regex）的处理是通过Pattern类实现的。Pattern类提供了多种标志（flags）来修改正则表达式的行为。其中，Pattern.MULTILINE和Pattern.DOTALL是两个常用的模式，它们分别用于处理多行文本和让.匹配包括行终止符在内的任意字符。参考文档：Java中正则表达式(regex)匹......
【2023年10月多校联训B层联赛2】珠子 &&【October 2023 Multi-School League B Tier
第一次用英语，见谅。为什么用英语？```Dev里懒得换输入法。```Link\(\textbf{gxyzoj\#3358}\)\(\textbf{LuoguU406794}\)DescriptionFhas\(n\)beadsarrangedinasequence,eachofwhichhasacolor,andatotalof\(m\)colors,numbered\(1,2,3,\cdots,......

MMFN论文阅读笔记（Multi-modal Fake News Detection on Social Media via Multi-grained Information Fusion）

介绍

方法

多模态特征编码器

通过BERT对文本特征编码

通过Swin-T对图像特征编码

相关文章

赞助商

阅读排行