51区未解之谜网

未解之谜与世界之最,猎奇文章

首页 > 科学探索 > AI系统:建立多维度向量进行数据检测

AI系统:建立多维度向量进行数据检测

时间:2018-12-30 19:35:02 作者:迷迷 来源:51区未解之谜网 手机阅读

在网络时代,虚假新闻是压倒一切的,令人困惑。Facebook曾一度陷入虚假新闻的泥潭,不仅被指控影响美国总统选举的结果,还被指控触发德国政府的巨额罚款。就连以信誉著称的BBC也不能幸免。例如,BBC北安普顿分部的Twitter账户就发送了这样一条信息:  

爆料新闻:特朗普总统在就职典礼上受枪伤。  

10月4日,麻省理工学院的计算机科学与人工智能实验室(CSAIL)在其官方网站上发布了一则消息,声称该实验室与卡塔尔计算研究所的研究人员合作,开发了一个人工智能系统,该系统能够识别信息源的准确性,并且能够识别p.个人政治偏见。这项研究的结果将于本月底在比利时举行。布鲁塞尔举行的2018年自然语言处理经验方法会议(EMNLP)正式宣布。  

研究人员使用人工智能系统创建了一个包含1000多个新闻源的开源数据集,这些新闻源被标记为真实性和偏见分数。据说,这是相似数据集中最多的新闻源。  

研究人员写道,打击虚假新闻的一种(希望)方法是关注来源。尽管虚假新闻(帖子)主要通过社交媒体传播,但它们仍然有自己的原始来源,也就是说,一种,所以如果一个网站发布了虚假新闻,那么它很有可能在将来被发布。  

人工智能系统的新颖之处在于它对所评估的媒体具有广泛的上下文理解。它并不仅仅从新闻文章中提取特征值(通过机器学习模型训练的变量),而是考虑维基百科、社交媒体,甚至基于URL和网络流量数据的结构来确定可信度。  

blob.png

系统的支持向量(SVM)训练用于评估事实和偏差。真实性分为:低、中、高;政治倾向分为:极左、左、中左、右、右和极右。  

该小组表示,该系统只需要检测150篇文章,即可确定新源代码是否可靠,在检测新闻源是否具有高度、低度或中度真实性方面具有65%的准确率,在检测其政治倾向是左倾、右倾还是中立方面具有70%的准确率。  

在上面显示的文章中,AI系统从六个维度测试了文章的文本和标题。它不仅分析了文章的结构、情感和参与(在本例中是股票数量、对Facebook的反应和评论),还分析了文章的主题、复杂性、偏见和道德观念,并计算了每个特征值的得分,然后对一组文章进行了平均评分。  

维基百科和Twitter也被添加到人工智能系统的预测模型中。正如研究人员所说,维基百科页面的缺失可能表明一个网站不可信,或者说提及这个问题的政治倾向可能是讽刺的或者显然是左倾的。此外,他们指出,信息公开不太可能。通过未经身份验证的Twitter帐户,或者使用没有明确标记的新创建的帐户,都是正确的。  

模型的最后两个向量是URL结构和网络流量,它们可以检测试图模仿可信新闻源的URL(例如,foxnews.co),参考网站的Alexa排名,该排名是根据网站的访问总数计算的。  

该小组在MBCF(MediaBiasFactCheck)网站上对1066个新闻源进行了AI系统培训。为了生成上述信息,研究人员在每个网站上发表了10-100篇文章(总共94814篇)。  

正如研究人员在报告中煞费苦心地介绍的那样,并非每个特征值都能有效地预测事实的准确性或政治偏见。例如,一些没有维基百科网页或Twitter档案的网站可能发布公平可信的信息,而Alexa排名靠前的新闻来源并不总是更公平或更真实。比那些交通不那么拥挤的人更可信。  

研究人员有一个有趣的发现:来自虚假新闻网站的文章更倾向于使用夸张和情绪化的语言,而左倾的媒体更倾向于提及公平和互惠。同时,维基百科页面较长的出版物通常更值得信任,包含少量特殊内容的URL也是如此。字符和复杂子目录。  

将来,研究小组打算探索人工智能系统是否可以适应其他语言(目前只有英语培训)以及它是否可以被训练来检测特定领域的偏见。他们还计划推出一个应用程序,通过政治领域的文章自动响应新闻。  

该论文的第一作者兼博士后助理RamyBaly说:如果一个网站之前发布了虚假新闻,他们很可能会再次发布它。通过自动从这些网站抓取数据,我们希望我们的系统可以帮助找出哪些网站可以首先这样做。  

新德里的初创公司MetaFact使用NLP算法在新闻报道和社交媒体帖子中标记错误信息和偏见;SAAS平台AdVerify。AI去年发布了测试版来分析错误消息、恶意软件和其他有问题的内容,并交叉引用定期更新的数据库,该数据库包含数千个错误和合法新闻。  

如前所述,一度陷入虚假新闻的Facebook已经开始使用人工智能工具来识别虚假新闻,最近收购了位于伦敦的初创公司Bloomsb.AI,以帮助其识别和消除虚假新闻。  

然而,一些专家不相信人工智能能够胜任这项任务。卡内基梅隆大学机器人研究所的科学家迪安·波默洛在接受外国媒体的采访时告诉《边缘》杂志,人工智能缺乏对语言的微妙理解,这对于识别谎言和虚假陈述至关重要。  

我们最初的目标是建立一个系统来回答,'这是假消息,是或不是,'他说,但我们很快意识到,机器学习不符合任务。  

但是人类事实检验员并不一定比人工智能做得更好。今年,在保守媒体指责谷歌对他们有偏见之后,谷歌暂停了过去在谷歌新闻上贴的标签FactCheck。  

然而,无论识别假新闻和个人偏见的最终解决方案是人工智能系统还是人为的,或者两者兼而有之,假新闻被消除的那一天都不会马上到来。  

咨询公司Gartner预测,到2022年,如果目前的趋势保持不变,大多数发达国家将看到更多的虚假信息而不是真实信息。  


相关文章

  • 小行星与地球“擦肩而过”仅隔4万公里
    小行星与地球“擦肩而过”仅隔4万公里
    据国外媒体报导,近日一颗直径约10米的小行星与地球擦肩而过,与地球的距离仅仅只有地球与月球距离的十分之一。而再过一段时间,将会有一颗直径约61米更大的小行星从地球旁边飞过。...
  • 中国学者多年专注农产品研究成果及最新的加工技术
    中国学者多年专注农产品研究成果及最新的加工技术
    今年上半年,我国农产品加工业深化了供方体制改革,加快了转型升级的步伐,质量和效率不断提高,生产率利用率不断提高,产业融合趋势明显,总体上呈现出平稳、升级的态势。近期,在中国食...
  • 美预计2020年将发射新火星车 再探火星生命
    美预计2020年将发射新火星车 再探火星生命
    2013年3月,好奇号研究小组宣布在火星耶洛奈夫湾发现湖床和河道系统,科学家认为这对微生物而言是个良好的生存环境,因此我们对火星是否存在微生物充满了好奇。根据最......
  • 早期病变的发现取决于早期诊断
    早期病变的发现取决于早期诊断
    虽然结直肠疾病种类繁多,但是对健康的最大威胁是结直肠癌。随着生活水平的提高和饮食习惯的改变,近年来我国结直肠癌的发病率显著增加,且年轻化情况更加明显。 结直肠癌的疗效...
  • 虚拟实验护航保障安全飞行
    虚拟实验护航保障安全飞行
    近日,114架ARJ21-700飞机在南通完成最后的试飞,并通过中国国家民用航空总局的认证成功交付成都航空公司,成为中国商用航空公司向成都航空公司交付的第9架ARJ21-700飞机。 多年...
  • 美国研制超音速战机SR-72 最高时速7200公里
    美国研制超音速战机SR-72 最高时速7200公里
    超音速战机技术层面有重大突破!美国国防工业制造商洛克希德·马丁(Lockheed Martin)公司表示,以6倍音速飞行的SR-72战机,最快可能会在2030年面世。SR-72战机最高时速能......
  • NASA最新发现:新行星人活15万年 五年才等于地球一天
    NASA最新发现:新行星人活15万年 五年才等于地球一天
    新行星人活15万年,最近美国宇航局NASA在太空探索中又有了一项新的发现,在M型红矮星EPIC 228813918的系外行星EPIC 228813918 b轨道时间流逝飞快,在这个星球上的五年才等于地球一天,如果能在这个奇特星球居住的话至少能活15万年,下面让我们一起去了解一下详细情况。...
  • 超乎理论30倍的超巨型怪物黑洞
    超乎理论30倍的超巨型怪物黑洞
    天文学家最近在一个有90亿岁的星系中央发现一个超巨型黑洞,但黑洞比现时已知理论所容许的大近30倍,完全超乎想像,连天文学家都吓得目瞪口呆。...
  • 无法破解的宇宙五大谜团 真的只有一个宇宙吗?
    无法破解的宇宙五大谜团 真的只有一个宇宙吗?
    在西汉《淮南子》曾有对宇宙的定义:往古来今谓之宙,四方上下谓之宇。可见古人已经开始对宇宙有一个概念了,但宇宙的奥秘似乎没那么简单就能解决,下面小编为大家盘点一下至今无解...
  • 宇宙中十大诡异天体 僵尸恒星会起死回生?
    宇宙中十大诡异天体 僵尸恒星会起死回生?
    宇宙中十大诡异天体,宇宙之中存在有很多诡异的天体,在目前人类发现的已知天体中以下十个天体可以说是最为诡异神秘的,宇宙中十大诡异天体分别是:黑寡妇星云、索隆魔眼、地狱行星、猩红之月、僵尸恒星、猎户座的蝙蝠、NGC 3393、小幽灵星云、土卫一、吸血鬼恒星,下面让我们一起去了解一下宇宙中十大诡异天体。...
.

科学探索

热门文章

热门文章

今日最新