科技行者 10月11日 北京消息:深度学习擅长在大量数据中发现模式,但无法解释它们之间的联系,而图灵奖获得者Yoshua Bengio想要改变这一点。
图:“将因果关系整合到人工智能中是一件大事!”——Yoshua Bengio
今年3月,Yoshua Bengio凭借着在深度学习技术的突出贡献而获得图灵奖,这是计算机科学领域的最高荣誉。正是深度学习技术掀起了人工智能的复兴浪潮,也一步步推动了无人驾驶汽车、即时语音翻译以及人脸识别成为可能。
而现在,Bengio指出“深度学习已经走到了瓶颈期”。他认为,除非深度学习能够超越模式识别并真正掌握因果关系的更多信息,否则它根本不可能发挥其全部潜力,也无法带来真正的AI革命。换句话说,深度学习应当开始理解“为什么”。
这位蒙特利尔大学(University of Montreal)教授已经55岁了,留着浓密的白发与眉毛。他解释道,深度学习技术在理想的场景下确实表现良好,但如果无法推理出因果关系,就无法接近人类的智力水平。“将因果关系整合到AI当中已经成为目前的头等大事。”Bengio说,“当前的机器学习实现方法立足一个基本假设,即经过训练的AI系统在解决实际问题时,面对的数据与训练数据属于同一类型。但在现实生活中,情况不可能如此简单。”
包括深度学习在内,目前的机器学习系统往往专用性极强,只针对特定任务进行训练,例如识别图像中的小猫,或者音频中的口语指令等。自2012年面世以来,深度学习已经展现出了卓越的数据模式识别能力,无论是从医学影像素材中发现癌症迹象,还是通过账目记录识别欺诈活动,深度学习技术已经被广泛应用于多种实际场景当中。
但是,深度学习本质上对因果关系是盲目的。与真正的医生不同,深度学习算法无法解释为什么特定的图像模式可能存在病变,这意味着某些危急情况下,我们必须谨慎使用深度学习。
而理解了因果关系之后,现有AI系统将在智能度与执行效率方面更上一层楼。举个例子,如果要让一个机器人意识到,快速下落的瓷器极易损坏,就不需要把几十个花瓶扔到地上再观察结果。
Bengio补充道,上面的例子也可以延伸到无人驾驶汽车。“人类不需要经历大量事故,才意识到谨慎驾驶的重要性,因为我们人类可以在脑海中想象事故场景,以便在事故真的发生时做好心理准备。”
问题在于,我们要如何为AI系统赋予这种能力?
Bengio在他的研究实验室里,正在开发一种能够识别简单因果关系的深度学习新版本。他和他的同事最近发表了一篇研究论文,概述了这种方法。他们使用一套数据集,该数据集以概率形式描述了真实世界现象之间的因果关系,诸如吸烟、肺癌等。在此基础上,他们又创建出直接包含因果关系的多套综合数据集。
论文中提到的算法,在本质上能够就哪些变量之间具有因果关系做出基本假设,而后测试不同变量的调整是否与其初步判断相吻合。例如,吸烟本身与癌症并非纯因果关系,但吸烟有可能诱发癌症的事实仍然不容辩驳,即使癌症也与其他一些因素(例如去医院就诊)相关,,这一事实也应该是显而易见的。
机器最终可能会利用这种方法来形成一种假设,即当物体掉落时可能发生什么,而后通过少数几次实际观察东西摔到地板上时,来确认自己的结论是否正确。
Bengio已经参与过一次AI技术革新。在过去几十年中,他与今年的另外几位图灵奖获得者(包括任职于多伦多大学与谷歌公司的Geoffrey Hinton,以及任职于纽约大学及Facebook的Yann LeCun)一起,共同发展出释放现代深度学习潜力的思想与工程技术。
深度学习利用人工神经网络生成并加强数学形式的联系,从而模拟人类神经元与突触的学习方式。训练数据(例如图像或者音频)会被馈送至神经网络当中,神经网络则对训练素材进行分析及自我调整,直到能够以正确的方式做出响应为止。因此在理论上,只要能够看到足够多的训练图像并拥有充裕的计算能力,深度学习程序即可通过训练以极高的准确率识别照片中的对象。
深度学习使用人工神经网络,通过形成和加强连接,在数学上近似于人类神经元和突触的学习方式。训练数据,如图像或音频,被输入到一个神经网络,这个神经网络会逐渐调整,直到它做出正确的反应。如果深度学习程序能看到大量的训练图像,并具有足够的计算能力,那么它就能被训练来识别照片中的物体,而且准确率很高。
但是,深度学习算法并不善于概括总结,也很难将自己在一种场景下学习到的知识应用于另一种场景。换句话说,深度学习只能捕捉到现象之间的相关性——例如公鸡啼叫与太阳升起,但却无法考虑产生这种相关性的深层次原因。
其他不少领域已经在因果关系研究方面投入了大量时间与精力,近几十年来出现了许多探索因果关系的数学技术,也彻底改变了包括社会科学、经济学以及流行病学在内的多个行业的研究范式。目前,已经有少数研究人员开始努力将因果关系与机器学习结合起来。
凭借因果推理方面的贡献获得2011年图灵奖的Judea Pearl表示,尽管并没有认真研究过,但Bengio的思考方式给他留下了深刻的印象。Pearl在最近合著的《因果之书:因果关系的新科学(The Book of Why: The New Science of Cause and Effect)》当中提到,如果没有对因果关系的推理能力,AI的发展将从根本上受到限制。
认知科学实验也表明,理解因果关系对于人类成长乃至智力发展至关重要,尽管我们尚不清楚人类是如何掌握这种关键知识的。
Bengio关于因果关系的研究,代表行业已经在这个问题的探索方面迈出重要一步。虽然只是一小步,但可以由此看到,深度学习正朝着现实主义方向勇敢前行,事实上,尽管这项技术的应用正在快速普及,但已经有越来越多的专家提到“其在语言理解等核心领域仍面临着严重局限”。
在采访当中,Bengio还对企业严重夸大AI及深度学习实际能力的行为表示失望。他指出,“在我看来,商界最好能扭转这一波不良风气,现在的炒作氛围实在太过浓重了。”
其他一些研究人员则认为,对深度学习的过度关注也是造成目前问题的原因之一。纽约大学名誉教授Gary Marcus在最近出版的《重新引导AI:构建我们能够信任的人工智能(Rebooting AI: Building Artificial Intelligence We Can Trust)》中提到,Bengio对因果推理的关注预示着技术思想层面已经开始出现可喜的变化。
他表示,“目前有太多深度学习项目都单纯关注缺少因果关系的粗糙关联性,这常常导致深度学习系统在真实条件下(明显不同于训练场景的条件下)进行测试时,往往拿不出良好的实际表现。”
Marcus认为,人类的行为应当成为指导AI技术发展的重要依据。“当孩子们提出「为什么」的时候,就代表他们想要了解现象背后的因果关系。一旦机器学会提出「为什么」,其智能化水平也将迎来真正的飞跃。”
好文章,需要你的鼓励
到2030年,智能互联设备的数量将突破500亿台。所有这些智能设备将通过蓝牙、Wi-Fi或5G等方式互联。
在当下的AI竞争格局下,没什么能比一场AI浓度爆表的大会,更能快速彰显自身实力了,AMD的这场「Advancing AI大会」,就是印证。
在今年云栖大会主论坛上,作为压轴的人形机器人对话——《人形机器人的“图灵时刻”》最受关注,这不仅可以看作是人形机器人创业者们的心路历程,也是半个世纪人形机器人产业发展的阶段性总结。