关键词不能为空

位置:爱淘啦励志网 > 经典语录 > 愚人节语言-语言研究者使用人工智能识别愚人节故事中的恶意“假新闻”

愚人节语言-语言研究者使用人工智能识别愚人节故事中的恶意“假新闻”

作者:车型网
日期:2020-03-31 21:25:36
阅读:

的研究人员正在开发识别网络上错误新闻的新方法

这不是开玩笑。 事实证明,4月1日至少有一件事是有益的。 帮助语言研究者识别更加恶意的“假新闻”。

美国兰卡斯特大学的计算和通信学院的学生爱德华·德·德·阿德丹博士和顾问Alistair Baron博士提出了利用互联网上出现的愚人节恶作剧故事的建设性方法。 他们利用他们研究欺骗性的语言,希望很多人能深刻理解所谓的“假新闻”。

当然,假新闻是一个复杂的术语,如果作者和读者只有不同的视点,就会有危险。 这意味着定义狭窄,故意和恶意错误消息将成为合法的新闻。

Dearden指出,愚人节的报道提供了“可验证的欺骗性文本”,通过电子邮件明确了这一点

也有权表达主观问题和意见。 把事物标记为真或假可能是滑坡。 关于愚人节淘气的有魅力的事,谁都同意他们不是真的。

作者一般研究在线虚假信息和欺诈行为,从370多个网站搜集了14年愚人节的文章。 他们最终收到了500多篇文章,把这些诈骗作品和同时期写的合法文章进行了比较。 根据他们的分析,试图写小说伪装成事实的人们使用同样风格的技术。

在将恶劣的文章与合法的新闻进行比较时,Dearden和Baron特别关注细节的数量、语言的模糊性、作者的文章风格形式、语言的复杂性。

接下来,我们从2017年的“假新闻”研究中得到一组数据(更具体地说,这些故事的标题),确定了欺骗性和恶意新闻故事的共同特征。 虽然识别这些故事不是可靠的方法,但研究人员发现,比起合法的、非欺诈的新闻,“假新闻”要短得多,易读,用简单的语言写出来,而且不是正式的名字。 这些故事(及其标题)包括更多专有名词、第一人称代词、亵渎和拼写错误、标点符号和日期。

与不是为了欺骗读者的新闻故事相比,愚人节的故事长度较短,容易读懂,多使用第一人称代词。 但也有更独特的单词,更长的句子,更少的固有名词。 欺骗性的故事往往涉及未来的模糊事件,包括现在更多的参考,更少的提到过去的事件。

不足为奇,愚人节和“假新闻”中,名字、地点、具体日期和时间都是新闻故事情况化的一部分,很少见。 专有名词,如同名字,是合情合理的。 政治家常见于“假新闻”。

但是,研究人员指出,使用第一人称代词,例如“我们”,在欺诈性的故事中意外突出。 因为想要模糊真相的人们往往不会使用。

Dearden和Baron的下一任务是制作机器学习分类器,判断文章是愚人节欺诈还是虚假新闻,还是真实新闻。 他们的算法在75%的时间内正确识别愚人节的文章,正确率是72%的假新闻。

但是,真正的挑战是他们能否根据愚人节的故事来训练数据,并用它来预测假新闻。 这说明了4月1日的这些故事如何帮助我们理解两者语言的相似性。 最后,愚人节的数据使分类器能够识别精度超过65%的其他假新闻。

关于人工智能研究范畴的大量研究涉及处理自然语言的机器学习系统。 基于算法的系统识别语言线索在很多大学和公司都有开发,为了公开对抗有意识的错误信息,想开发“假新闻”探测器。 因为人的编辑完全赶不上,所以研究者积极地致力于最危险的欺诈活动。 这些活动通常通过社交媒体迅速传播。 语法、单词选择、标点符号等可量化属性能够进行语言分析的机器,能够更好地截获潜在的有害故事。

但是,研究人员也意识到要判断“假”和合法的困难。 我们之所以还没有很多假新闻探测器,是因为研究人员正在进行AI算法的更严格的测试和训练系统的数据收集。

正如Dearden对我所说明的那样,他们的研究只是一个难题,不是全面的核对表,而是人们可以用它来确定一个完美的误解副本

我们的研究目的是理解恶作剧新闻中所用的词语,并了解它与各种被称为“虚假新闻”的虚假信息有何关联。 我们论文讨论的功能都不是检测假新闻的银弹。

但是,这项研究有助于人们发现警告信号,理解他们所读的内容。 用批判性思维和事实来检查新闻的方法超出了这个特定的研究范围,但是Dearden说他们教给电脑发现非法文本的工作是重要的课题。

目前在打击虚假信息方面有很多非常有趣的工作。 这是特别重要的。 因为社会真的很难适应现在的信息量,会产生实际的结果。 希望研究界能够解决这个问题,开发出将影响抑制在最小限度的方法。

Dearden和Baron将在4月下旬在法国罗素·谢尔召开的第20届计算语言学和智能文本处理国际会议上展示这项研究。

爱淘啦励志网相关推荐