首页 > 其他分享 >2020 美国大选在即,假新闻也在路上了

2020 美国大选在即,假新闻也在路上了

时间:2023-08-04 21:33:20浏览次数:31  
标签:可信度 2020 Logically 假新闻 特朗普 事实 大选


By 超神经


场景描述:出于宣传、牟利等目的,互联网上充满了各种虚假、误导性消息,这类消息被称之为「假新闻」。如何鉴别假新闻,防止被骗,一直以来困扰着大众。为此,一家英国初创公司研发人工智能算法来识别假新闻,防止其进一步传播。


关键词:假新闻 自然语言处理 事实检查


近年来,「假新闻」一词的出现频率开始攀升,尤其在 2016 年的美国大选,更是将「假新闻」推至舆论中心,让其使用率增加了三倍多。


据统计,当时在 Facebook 上,有利于特朗普的假新闻的互动次数达到 830 多万次,而主流媒体的真实新闻相应数字为 730 多万。


2020 美国大选在即,假新闻也在路上了_社交媒体

2016 美国大选中,假新闻称现任教皇支持川普的新闻,

获得近百万互动,后续辟谣阅读量却寥寥无几


今年美国大选在即,受席卷全球的新冠疫情、经济衰退、地区争端等问题影响,可想而知,大选必定面临着比以往更严峻、复杂的假新闻的挑战。



 创作竞选假新闻,养活一城年轻人


创作假新闻的理由千千万,或出于偏见,或暗藏政治目的,有些纯粹为了经济利益。


2016 年,美国大选活动的最后三个月里,突然涌现了一百多个和特朗普有关的网站,发布的都是支持特朗普的新闻,还都使用美国网站域名。


2020 美国大选在即,假新闻也在路上了_自然语言处理_02

各类假新闻涵盖经济政策、党派黑料、候选人八卦

有些假新闻的离奇程度,令人嗔目结舌


可是这些网站背后并不是候选人,也不是候选人的支持者,甚至不在美国本土,而全都来自欧洲小国北马其顿的一个小城 Veles。


Veles 是一座人口只有 45000 人的小城,经济极其不景气,人均月工资只有 350 欧元(约 2600 元人民币),这样的经济环境下,年轻人找工作难如登天。


他们无法通过正规途径工作就业,便动起了歪脑筋。


他们发现,将对特朗普有利、具有煽动性的假新闻发布到网站上,特朗普的支持者们会积极扩散,而为网站或账号带来巨大的流量,靠着广告就可以狠赚一笔。


2020 美国大选在即,假新闻也在路上了_自然语言处理_03

BBC、连线杂志都曾以深度报告的形式,揭露了这一现象


每篇假新闻的创作费用是 3 欧元,手快的年轻人一天至少能挣 24 欧元,一个月能收入 500-2000 欧元。


这些假新闻也不全是凭空捏造的,不少假新闻以真实新闻作为蓝本。假新闻作者会在一则真实事件的基础上进行添加、杜撰成误导性、煽动性的信息,整合成一则假新闻。


所以面对五花八门的假新闻,普通民众想要鉴别其真伪并不容易。



 检测假新闻,必须来点儿硬核的


来自印度迈索尔(Mysore)的工程师 Lyric Jain,感受到假新闻对政治局势、人民生活的重大影响之后,想尝试利用技术改善这一情况。


2020 美国大选在即,假新闻也在路上了_自然语言处理_04

创始人 Lyric Jain 毕业于剑桥大学,获工程硕士学位


于是,他成立了一家专门进行假新闻检测的公司 Logically,借助人工智能技术来解决这一难题。


Logically 旨在利用机器学习、自然语言处理和人为监督,来消除偏见和错误信息。


2020 美国大选在即,假新闻也在路上了_人工智能_05

公司还提供事实核查服务,以打击假新闻


近日,Logically 获得了 277 万欧元(约合人民币 2201 万元)的融资,用于在美国大选前,进一步开发其假新闻检测产品。


Logically 已和美国公共部门和社交媒体平台签订了合作合同,将在今年的美国大选中,为假新闻的检测提供技术合作。


 曾成功用于印度大选的技术,强在哪里?



2019 年,该公司的技术已在印度大选和地方选举中成功使用。


在 2019 印度大选期间,Logically 检测出了 200 多万篇不可靠的文章,发现了 5 万多条假新闻。


2020 美国大选在即,假新闻也在路上了_社交媒体_06

去年印度大选,Logically 检测出上万条假消息


在技术方面,Logically 不断地从互联网收集数据,实时监控超过 100 万个域名和主要社交媒体平台,并能在数小时内添加新闻来源,包括小众平台。


团队设计的算法,从网络、元数据和内容三个方面,三管齐下,使用自然语言处理和知识工程技术来提取消息中的主题和概念,从而更好地理解内容。


2020 美国大选在即,假新闻也在路上了_社交媒体_07

Logically App 会向其用户提供新闻可信度鉴定结果


在评估新闻可信度上,分为来源可信度、文章可信度和品牌安全度三个维度,最终将消息标记为高度可信,中等可信度和低可信度。



 传谣一张嘴,辟谣真的跑断腿


据 MIT 的 AI Lab 研究过往报告中称,假新闻在社交媒体的传播速度,是真实新闻的 6 倍,且假新闻更容易得到转发。


Logically 的算法已经针对 70 万篇文章、大约 2000 万个句子进行了训练。


该算法不仅会筛选出假新闻,而且会突出显示判断它的依据——例如标题或文章内容不和谐、逻辑谬误、含有政治偏见和不准确的统计信息等。


此外,Logically 还在社交网络上,使用各种社交媒体智能工具,来检测和监视自动(机器人)帐户以及其他虚假用户信息。


2020 美国大选在即,假新闻也在路上了_人工智能_08

Logically 官网显示,迄今已完成 8892 次事实核查和

216 次实时的事实核查


公司的事实检查业务包括验证用户的信息、确保消息中的观点基于事实。


此外,公司还为假新闻、阴谋、仇恨言论和虚假声明开发定制数据集。这些用于特定领域训练的基本数据集,基于标准的自然语言处理(NLP)问题,如情感、事件提取和 NERD(命名实体识别和消歧)。


 人机搭配,摘下「假新闻 」的面具


成立三年多,Logically 如今已拥有 70 多名成员,但他们不只是诸如后端开发人员、数据科学家之类的开发者,心理学家、行为科学家、事实检查人员、内部编辑记者,也是团队中重要的一部分。


公司有一组专门进行事实核查的人员,他们结合人工智能和数字取证技术,来分析媒体报道和阴谋论,帮助公众将事实和谎言区分开。


据称这也是世界上最大的事实检查团队。此外,还有几位内部记者来监督事实检查人员,以确保消息符合国际事实检查网(IFCN)标准。


2020 美国大选在即,假新闻也在路上了_人工智能_09

用户可以将自己不确定的网络消息,发给该团队来检查真伪


创始人 Lyric Jain 解释道:「我们认为,人工智能应该补充而不是取代人类。我们的技术与新闻编辑、事实核查人员一起工作,以评估新闻报道。


再过三个多月,美国就要迎来全国总统大选的日子,不知届时 Logically 能否有效管制「假新闻」,帮助美国民众选出真正符合民意的总统。




参考资料:

-https://www.eu-startups.com/2020/07/fake-news-detection-startup-logically-raises-e2-77-million-to-prepare-for-us-elections/

-https://yourstory.com/2019/08/ai-startup-bengaluru-logically-fake-news-brexit

-https://www.logically.ai/


2020 美国大选在即,假新闻也在路上了_自然语言处理_10

标签:可信度,2020,Logically,假新闻,特朗普,事实,大选
From: https://blog.51cto.com/u_16060192/6968688

相关文章

  • 漏洞复现报告:CVE-2020-2883 Weblogic反序列化漏洞
    OracleWebLogicServer漏洞研究报告一、漏洞信息搜集1.1漏洞信息表漏洞名称OracleWebLogicServer反序列化漏洞发布时间2020年4月16日漏洞编号CVE-2020-2883威胁类型反序列化漏洞危害级别高危影响版本OracleWebLogicServer10.3.6.0.0、12.1.3.0.0、12.2.1.3.0、12.2.1.4.0版......
  • Aapache Tomcat AJP 文件包含漏洞(CVE-2020-1938)
    AapacheTomcatAJP文件包含漏洞(CVE-2020-1938)【项目中遇到过】1.背景简述java是目前WEB开发中主流的编程语言,而Tomcat是当前流行的Java中间件服务器之一。Ghostcat(幽灵猫)是由长亭科技安全研究员发现的存在于Tomcat中的安全漏洞,由于TomcatAJP协议设计上存在缺陷,攻击者通......
  • 2020上海静安国际大数据论坛成功举行
     Datawhale活动 2020上海静安国际大数据论坛10月22日,由上海市经济和信息化委员会、上海市静安区人民政府、上海市大数据中心指导,上海市北高新(集团)有限公司主办,上海市北高新股份有限公司、机器之心(上海)科技有限公司承办的2020上海静安国际大数据论坛在上海市静安区市北高新商务......
  • 2020年社招面试技巧总结!
     Datawhale干货 作者:小白泽,复旦大学,Datawhale成员最近刚跳槽刚结束,也拿到了几家一线大厂的核心的offer,总结一下经验希望能帮到其他同学。这里不介绍具体的面试问题,只介绍些方法论。1.自身情况简单介绍下自身情况:国内top3硕士(众所周知,top3共有九所高校),某二线互联网企业算法工......
  • P7116 [NOIP2020] 微信步数
    原题简化题意:有一个k维场地,第i维宽为wi,即第i维的合法坐标为1,2,···,wi。小C有一个长为n的行动序列,第i元素为二元组(ci,di),表示这次行动小C的坐标由(x1,x2,...,xci,...,xk)变为(x1,x2,...,xci+di,...,xk)。小C会将行动......
  • 【csp2020】 方格取数 题解
    洛谷传送门1.题目大意给定一个\(n*m\)的矩阵,矩阵中每个点\((i,j)\)都有一个权值\(f_{(i,j)}\)。每次可以向上,向下或向右走。问从\((1,1)\)走到\((n,m)\),经过的路径上点的权值之和最大是多少?2.思路这道题我们不难想到动态规划。但是与一般的动规不同的是,本题中有上下右......
  • CCPC Changchun 2020 D, Meaningless Sequence题解
    听说是签到题。不难看出设x为i二进制个数下1的个数(还是难的),则a_i=c^x。那么我们只需要考虑所有0到n的个数。当n为1111时,可以得到为(1+c)^n次方,那么我们把答案看成两部分一部分是1到111...和1000到n,那么当si位为1时,可以看成是n去掉前一位后再乘以c,递推得到每一个位置的答案,就是......
  • 论文解读|2020 CVPR:PointASNL:基于自适应采样的非局部神经网络点云鲁棒处理
    原创|文BFT机器人01摘要使用自然图像数据集(如ImageNet)中的大型预训练模型进行迁移学习已经成为医学成像深度学习应用的实际方法。然而,由于自然图像分类和医学成像任务之间的差异,对迁移学习的影响了解甚少。本文对医学影像迁移学习进行了探讨,并对两个大型医学成像任务进行了性能......
  • 题解 P9406【[POI2020-2021R3] Nawiasowania】
    一个显然的思路是:在排列\(p\)的括号串合法的基础上,使得左括号在原括号串中尽量靠左,这样答案更有可能合法。于是我们求出这个原括号尽量靠左的括号串(下文称为“最优括号串”),然后check合法性即可。下文中\(s\)是排列\(p\)的括号串。当\(n=2\)时,唯一的填法是令\(s_1\get......
  • Adobe Animate (An) 2020网页设计软件下载和安装教程
    AnimateCC于2016年1月推出。同时,Adobe还将推出适用于桌面浏览器的HTML5播放器插件,作为其现有移动端HTML5视频播放器的延续。此外,根据Adobe官方原文的描述,公司将继续与业界伙伴如微软、Google等合作加强现有Flash内容的兼容性和安全性。AnimateCC将拥有大量的新特性......