acm-header.
登入

ACM的通讯

研究亮点

技术视角:利用虚假新闻检测的社会背景


有报纸的人和一个真假十字路口的标志,例证

随着社交媒体作为信息的关键来源,恶意用户开始操纵社交平台到自己的目的。今天,在线不奉献努力(所谓的互相)经常滥用公开辩论,政治事件和信息活动。通过在线社交媒体检测假新闻已成为一个核心问题,培养恶意用户和平台运营商之间的军备竞赛。

至今,已经开发出两种广泛的策略来自动检测在线媒体上的虚假活动:分析信息内容- 自然语言处理技术3.或权威信息来源或分析其语境例如,通过探索最终用户,发布者和新闻部件之间的相互作用。5.在下文中,作者通过引入虚假新闻检测的新图形,上下文技术,重点关注后一种策略。他们的方法是基于两个主要支柱:一方面是社会背景的结构上丰富的图表表示,另一方面利用归纳方法的专用学习框架。

作者介绍的新图表表示重组正在分析的所有新闻文章,他们的来源,他们从事宣传这些文章的用户以及社交网络中的所有直接邻居。这造成了丰富的社会背景图包括均匀链接(在彼此的对用户对之间或源之间的源之间建模相互作用)和异构链接(在新闻文章和其源之间的建模关系,或者用户与她促进的新闻文章之间)。

图中的每个实体最初由利用经典的静态特征向量表示(例如,手套4.)嵌入。然而,社会上下文图是高度动态的,新节点和边缘不断出现在用户的动作之后。因此,作者采用了归纳方法来表示学习,即石斑鱼,1可以通过从节点的本地邻域的采样和聚合功能来动态有效地创建节点嵌入物。这些嵌入的嵌入式进一步丰富了时间接合模式,因为已知用户的行动的时间性在假新闻传播中起着核心作用。2

评估芳这样的系统的性能是精致的;在此上下文中的经验评估通常依赖于大型标记的数据集,其中一个必须挑选一个明确的标签(如伪造的或者不假)对于集合中的每个文档。但是,这种决定并不总是清除,因为某些文本可能是半成方,而其他一些文本可能很难验证 - 甚至是人类专家 - 或者甚至可能是主观,具体取决于精确的主题(例如,对于有争议的主题或意见。)

作者在这方面没有创新:他们在预先存在的推文上进行他们的实验,这些推文被两个权威来源分类为假,即溜走政策。它们通过在所描述的图形表示模型的顶部应用专用的学习框架来衡量其方法的性能,并且表明它们的技术即使具有非常有限的训练数据。本文讨论的经验证据广泛且包括各种假新闻检测实验,对新代表学习框架的普遍性的外在评估,以及来自Twitter数据集的具体情况的微观分析。

最后,方的芳皮大致优于数据集上的最新状态,AUC为75%。此结果代表了在该域的未来研究的警告故事。虽然使用广泛的特征和复杂的技术,但是,鉴于手头任务的复杂性,福明远未达到最佳性能。此外,在仅由两个明确的类别组成的高度策划数据集上获得了相对谦逊的分数,而现实是不幸的更复杂:诸如的事实检查网站溜走通常考虑整个非二元标签,以对他们调查的文章进行分类,利用细粒度的评分,如主要是假讽刺错了, 或者未经证明对于挑战性案件。

本文在2020年代后期,慈杉的最佳纸质奖励 - 考虑到会议的主要研究赛道,没有小小的壮举。即使在非策划数据集上的完全自动化方法等方面的性能仍然很大程度上尚不清楚,本文也是一个非常引人注目的作品,结合了社交媒体的新的上下文图模型,以及最近的代表学习进步,以解决一个重要及时的问题。我希望你喜欢像我一样读它。

回到顶部

参考

1.汉密尔顿,W.L.,Ying,Z.,Jure Leskovec,J.归纳代表在大图中学习。NIPS 2017.1024-1034。

2. ma,J.等。用经常性神经网络检测来自微博的谣言。IJCAI 2016.3818-3824。

3. Oshikawa,R.,钱,J.,Wang,W.Y。假新闻检测的自然语言处理调查。LREC 20206086-6093。

4. Pennington,J.,Socher,R.,Manning,C.D。手套:全球向量的字样。Emnlp 2014.,1532-1543。

5.舒,K.,王,S.,刘,H.超越新闻内容:社会背景对假新闻检测的作用。WSDM 2019.,312-320。

回到顶部

作者

PhilippeCudré-Mauroux是瑞士弗里堡大学计算机科学教授。

回到顶部

脚注

查看随附的论文,访问doi.acm.org/10.1145/3517214


作者持有的版权。
请求权限(重新)从业主/作者发布

数字图书馆由Computing Machinery协会发布。版权所有©2022 ACM,Inc。


没有发现任何条目

登入完全访问
“ 忘记密码? »创建ACM Web帐户
文章内容:
Baidu
map