靠AI阻击假新闻,或许没那么乐观

2018年10月29日09:03  来源:科技日报
 
原标题:靠AI阻击假新闻,或许没那么乐观

近日,麻省理工学院计算机科学与人工智能实验室宣布与卡塔尔计算研究所合作,研究出一种可以鉴别信息来源准确性和个人政治偏见的AI系统。

据报道,实验室研究人员利用这个AI系统创建了一个包含1000多个新闻源的开源数据集,这些新闻源均被标注了“真实性”和“偏见”的分数。并且,AI系统对其所评估的媒介有广泛的语境理解,不只单独从新闻文章中提取特征值,而是兼顾了维基百科、社交媒体,甚至根据URL和Web流量数据的结构来确定可信度。人类与假新闻的战争旷日持久,这次这个新的AI伙伴会帮助人类更快取胜吗?

做法不难,但需要丰富数据源

谈及AI的这个本事,中科视拓(北京)科技有限公司CEO刘昕表示:“相关做法并不难。我认为这是一个非常基础的文本分类,看介绍这个系统会标记出各类新闻是真的、假的、是否存在偏见,这是一个基础的算法,就像标记图片中的猫、狗一样,做出分类,然后可以识别一张新的图片是猫还是狗,所以这本身是一个比较简单的文本分类技术。”

不过虽然原理不难,但实现难度不小。谈到实用性,刘昕认为,决定AI监测假新闻效率的关键在于识别数据的量级是否足够大、假新闻的来源和数量是否足够丰富。要成功判断出新闻是不是被捏造的,用来训练AI的假新闻的数据库必须够大。

另外就是“如何抽取新闻文本中的信息”,是采用简单的分词的技术还是更高阶的文本语义理解。“有足够的假新闻用于学习,采用文本语义的信息抽取方式,可以让AI的工作更有效、准确率更有保证。”刘昕表示。

在扩充数据量以及兼顾不同倾向的数据方面,这个新的AI系统作出有效改进:根据介绍,维基百科和推特被加入了系统的预测模型。正如研究者所说,维基百科页面的缺失也许说明了一个网站是不可信的,相关网页上也可能会提到这个问题的政治倾向如何。此外,他们还指出,没有经过验证的推特账户,或者使用新创建的没有明确标注的账户发布的消息,真实的可能性很低。

(责编:郜林筱(实习)、陈康清)

热闻推荐

动感H5欣赏

  • 知行合一看修文知行合一看修文
  • 美丽贵州行-务川美丽贵州行-务川
  • 我们的贵州会呼吸我们的贵州会呼吸
  • 你好,我叫贵州!你好,我叫贵州!

新媒体运营

  • 贵州频道微信公众号贵州频道微信公众号
  • 贵州频道手机版贵州频道手机版
  • 贵州频道新浪微博贵州频道新浪微博
  • 贵州频道人民微博贵州频道人民微博