麻省理工学院与Qatar科学家打造AI系统辨识假新闻从来源着手
麻省理工学院(MIT)电脑科学暨人工智能实验室(Computer Science and Artificial Intelligence Lab,CSAIL)与卡塔尔计算研究所(Qatar Computing Research Institute,QCRI)正在打造一基于机器学习AI系统,能够根据新闻的来源来辨识假新闻,目前在侦测事实可靠性上有65%的准确度,对于政治倾向的判断则有70%的准确度,将可搭配事实查核网站使用,以减少假新闻流窜的时间。
科学家表示,近来的事实查核世界已产生了危机,诸如Politifact或Snopes等网站都是针对某一主题进行查核,只不过,当他们查明或揭穿事实时,这些假新闻或谣言可能已经绕了地球一圈。
于是CSAIL及QCRI认为最好的作法是不只专注于个别新闻的查证,还必须注重新闻来源,使得他们决定打造一个机器学习系统,可用来快速判断新闻来源是否可靠或者带有政治上的偏见。
该研究的主要作者Ramy Baly表示,如果一个网站曾出版过假新闻,那它很有可能会再犯,该系统可自动抓取这些网站的数据,并在第一时间察觉,而且只需要150篇文章来判断新闻来源的可靠度,之后即可在假新闻被广泛散布前就逮住它。
这群科学家先取用了来自Media Bias/Fact Check(MBFC)的数据,这是一个集结人类事实查核员的网站,已分析超过2,000个新闻网站的可靠度,从知名的MSNBC到属性农场,并把这些数据汇入机器学习演算法,以建立同样的分类模式。
该系统还会检查新闻出处的维基百科页面来评估新闻来源的可靠程度,例如若维基百科的属性愈丰富,那幺该站就相对可靠,假设出现了”极端”或”阴谋论”等文字,代表它可能有所偏颇。
当把一个新闻出处输入该系统时,在辨识该出处的新闻真实性(高、中、低)时已有65%的准确度,判断它是左派、右派或中立立场的准确度则有70%。该研究的共同作者Preslav Nakov表示,目前此一系统还不够完善,在准确度上仍需加强,最好的方式是与传统的事实查核机制一起运作。
科学家们也已建立一个内含1,000个新闻来源的开源资料集,并加注了这些新闻来源的真实性及偏见分数,下一步将尝试把以英文训练的系统转为其它语言,也会新增诸如宗教等政治以外的偏见指数。
版权声明:以上内容为用户推荐收藏至Dreamgo网站,其内容(含文字、图片、视频、音频等)及知识版权均属用户或用户转发自的第三方网站,如涉嫌侵权,请通知copyright@dreamgo.com进行信息删除。如需查看信息来源,请点击“查看原文”。如需洽谈其它事宜,请联系info@dreamgo.com