布朗大学研究人员教会计算机看到光学错觉

【据美国布朗大学网站2018年9月21日报导】通过建立能像人一样被光学错觉所愚弄的神经网络模型,布朗大学的研究人员提高了人类视觉系统的知识,并且可以帮助改善人工视觉。

光学错觉对于体验和辩论来说很有趣,但是理解人类大脑如何感知这些不同的现象仍然是科学研究的一个活跃领域。对于一类被称为上下文现象的光学幻觉,感知是依赖于周围环境的。例如,你认为一个中心圆圈的颜色取决于周围的环的颜色。有时外色使内色看起来更相似,比如相邻的绿环使蓝环看起来像绿色,但有时外色使内色看起来不太相似,比如粉色环使灰色环看起来像绿的。布朗大学的一个计算机视觉专家小组回到了正方形,以理解这些背景现象的神经机制。

为了这项研究,由布朗大学卡尼脑科学研究所所所属的Serre教授领导的小组从受视觉皮层解剖学和神经生理学数据约束的计算模型开始研究。该模型旨在捕捉相邻皮层神经元如何相互发送信息,并在呈现复杂刺激(如上下文视错觉)时调整彼此的反应。Serre表示,该小组在他们的模型中包含的一个创新是假设神经元之间的反馈连接的特定模式。根据视觉环境,这些反馈连接能够增加或减少兴奋或抑制中枢神经元的反应。这些反馈连接不存在于大多数深度学习算法中。深度学习是一种强大的人工智能,它能够学习数据中的复杂模式,例如识别图像和解析正常语音,并且依赖于多层人工神经网络协同工作。然而,大多数深度学习算法只包括层之间的前馈连接,而不包括层内神经元之间的Serre的创新反馈连接。一旦构建了模型,团队就呈现了各种上下文相关的幻觉。研究人员“调整”了反馈兴奋或抑制连接的强度,使得模型神经元以一种与灵长类视觉皮层的神经生理学数据一致的方式作出反应。然后他们在各种情境幻觉下测试模型,并再次发现模型感知像人类一样的幻觉。为了测试他们是否使模型变得不必要地复杂,他们损坏了模型——选择性地去除了一些连接。当模型缺少一些连接时,数据与人类感知数据不匹配。

除了为人类如何看待一类光学错觉提供统一的解释之外,Serre还在此模型的基础上构建以提高人工视觉为目标。他指出,目前最先进的人工视觉算法,例如那些用来给脸贴标签或识别停车标志的算法,在观察上下文方面有困难。通过包含由上下文相关的光学幻觉所调整的水平连接,他希望解决这个弱点。也许考虑上下文的视觉深度学习程序将更难被愚弄。Serre表示,当某个标签贴在停车标志上时,它会诱使人工视觉系统认为它是一个每小时65英里的限速标志,这是危险的。

该研究获得了美国国家科学基金会和国防部高级研究计划局的资助,相关论文《Complementary surrounds explain diverse contextual phenomena across visual modalities》发表在Psychological Review上。

赞赏

长按二维码向我转账

受苹果公司新规定影响,微信 iOS 版的赞赏功能被关闭,可通过二维码转账支持公众号。

    阅读原文

    阅读

    阅读原文

    微信扫一扫
    关注该公众号

    微信扫一扫
    使用小程序

    即将打开”“小程序
    取消 打开

    Copyright Disclaimer: The copyright of contents (including texts, images, videos and audios) posted above belong to the User who shared or the third-party website which the User shared from. If you found your copyright have been infringed, please send a DMCA takedown notice to copyright@dreamgo.com. For more detail of the source, please click on the button "Read Original Post" below. For other communications, please send to info@dreamgo.com.
    版权声明:以上内容为用户推荐收藏至Dreamgo网站,其内容(含文字、图片、视频、音频等)及知识版权均属用户或用户转发自的第三方网站,如涉嫌侵权,请通知copyright@dreamgo.com进行信息删除。如需查看信息来源,请点击“查看原文”。如需洽谈其它事宜,请联系info@dreamgo.com

    Read Original Post查看原文