MDFEND: Multi-domain Fake News Detection

时间：2022-11-22 17:00:39浏览次数：84

MDFEND：多领域假新闻检测

作者：南琼、曹娟 CIKM 2021 short paper

论文地址：https://arxiv.org/pdf/2201.00987.pdf

数据集和代码：https://github.com/kennqiang/MDFEND-Weibo21

本文首次建模和探索多领域虚假新闻检测问题。具体地，我们首先构建了首个中文多领域虚假新闻数据集——Weibo21，该数据集包含来自于政治、军事、社会生活等9个领域的真假新闻数据；此外，我们提出了一种简洁而有效的多领域虚假新闻检测模型——MDFEND，该模型通过“领域门”聚合多个“专家”的表示。实验表明，我们的方法在多领域虚假新闻检测效果上有显著提升。

一、中文多领域虚假新闻检测数据集Weibo21

从微博社区管理中心爬取了从2014年12月至2021年3月的数据，为了获取真实数据，我们收集了被睿鉴识谣平台核实为“真”的数据，并保证了数据的时间分布范围与虚假数据一致。对于每一条数据，我们收集了多个维度的信息，包括文本内容、配图、时间戳、评论、辟谣信息（只针对虚假信息）。我们发现，收集到的原始数据存在很多重复，因此我们采用one-pass聚类的方法进行去重。最终我们获得了4,488条虚假新闻和4,640条真实新闻。

我们参考了多个事实核查网站和相关研究报告后，确定了以下9个领域：科技、军事、教育、事故、政治、健康、财经、娱乐、社会。10名标注人员独立对整个数据集进行了领域标注，当多于8名标注人员达成一致时就确定最终的领域标签，否则进一步讨论、评估以达成一致。最终的数据统计信息如表1所示。

二、多领域虚假新闻检测模型MDFEND

我们提出了多领域虚假新闻检测模型MDFEND，整体框架如下图所示。

详细框架解读见：https://zhuanlan.zhihu.com/p/443690475

三、实验

上表中分别为：

l 单领域模型基线：TextCNN_single 、BiGRU_single、BERT_single；

l 混合领域模型基线：TextCNN_all 、BiGRU_all、BERT_all；

l 多领域模型基线：EANN、MMOE、MOSE、EDDFN。

（吐槽……）：

尽管他是short paper我也没有嫌弃他，个人还是从主观上对他很感兴趣，珍藏了半个月打算有空的时候一定要拿出来仔细观摩一下，因为我以为的Multi-domain是多模态，是我知识浅薄了，也可能是我魔怔了居然下意识就把这两个东西想成了一个东西……

标签：MDFEND,Multi,新闻,虚假,domain,领域,检测,数据
From： https://www.cnblogs.com/zhouyeqin/p/16915694.html

macOS brew install 404：Bottle missing, falling back to the default domain错误的修
更新镜像源临时：exportHOMEBREW_BREW_GIT_REMOTE="https://mirrors.ustc.edu.cn/brew.git"brewupdate优秀不够，你是否无可替代软件测试交流QQ群：721256703，期待你的加入！！欢迎......
UnicodeDecodeError：'gbk' codec can't decode byte 0x80 in position 0 illegal multi
UnicodeDecodeError：'gbk'codeccan'tdecodebyte0x80inposition0illegalmultibytesequence 回答1ifyouwillopenfilewithutf-8,thenyouneedwrite:o......
同步与异步 multiprocessing 进程对象多种方法
目录同步与异步阻塞与非阻塞综合使用创建进程的多种方式前言windows系统创建进程的问题（重要）multiprocessing模块之Process展现异步创建进程的方式（一）：使用Process()创建进程......
同步、异步与阻塞、非阻塞的概念、创建进程的多种方式及multiprocessing模块、进程间
目录一、同步与异步同步异步二、阻塞与非阻塞阻塞非阻塞三、综合使用1.同步阻塞：2.同步非阻塞：3.异步阻塞：4.异步非阻塞：四、创建进程的多种方式进程的创建multiprocessing模块......
SVG Line Between Divs (multi-point)
<!doctypehtml><html><head><metacharset="utf-8"><title>SVGLineBetweenDivs(multi-point)</title><style>html,body{margin:0;padding:0;}......
Multivariate LSTM-FCNs for Time Series Classification 论文学习记录
AbstractOverthepastdecade,multivariatetimeseriesclassificationhasreceivedgreatattention.Weproposetransformingtheexistingunivariatetimeseries......
Multivariate LSTM-FCNs for Time Series Classification 论文理解
基础知识Q1：什么是时间序列？**A1：**时间序列是一组按时间顺序的数字序列，它既具有延续性又具有随机性**Q2：**时间序列分为哪几类？A1：分为单变量、多变量、单步、多步。简单的说就......
python multiprocessing 多进程
1获取进程id当我们运行py文件时，该程序的运行就是一个进程，如果在该进程中又创建了其他进程，那么该进程就是主进程，创建的其他进程就是子进程。下面我们通过通过os库中的方法......
ParaView中主显示区pqTabbedMultiViewWidget的对象层次
......
2022 年杭电多校第六场 Multiply 2 Divide 2
2022年杭电多校第六场Multiply2Divide2题意：BXY的序列\(a\)长度为\(n\)\((1\leqn\leq10^5,1\leqa_i\leq10^5)\)对于每个操作，他选择一个数字\(a_i(1\leqi\leqn......

MDFEND: Multi-domain Fake News Detection

相关文章

赞助商

阅读排行