微信扫一扫,关注公众号

  • 科技行者

  • 算力行者

见证连接与计算的「力量」

首页 对话Google产品经理、AI前沿发起人:这波人工智能热潮从何而来?

对话Google产品经理、AI前沿发起人:这波人工智能热潮从何而来?

2017-11-09 20:55
----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.-
2017-11-09 20:55 沃顿知识在线

AI炒作的背后是什么?Google产品经理是这么认为的

AI Frontiers conference将于11月3日至11月5日在美国加利福尼亚州的圣克拉拉市举行,Google出色的产品经理Apoorv Saxena也是AI Frontiers conference的发起人之一,他在接受沃顿知识在线(Knowledge@Wharton)的采访时谈到了为什么人们对于人工智能的兴趣正在日益增长,短期内的未来会怎样以及还有哪些挑战需要花更长的时间来克服。

下面是经过编辑的采访记录。

沃顿知识在线(Knowledge@Wharton):近来人们对人工智能的兴趣急剧增长。是什么在推动这波炒作?关于人工智能的一些最常见的误解是什么?你会如何将炒作与现实区分开来?

Apoorv Saxena最近有很多因素引发了人们对人工智能的兴趣。首先是人工智能在处理一些长期存在的问题上取得了重大进展。这些主要是指图像和语音理解方面的问题。例如,现在的电脑能够比人类更好地誊写人类的讲话。理解语音的工作已经进行了大约二十到三十年,直到最近我们才看到这方面的重大进展。对图像的理解也是类似的情况,一些人类语言理解的具体部分——例如翻译——也是如此。

通过应用一种被称为深度学习的旧技术并将其运行在高度分布和可扩展的计算基础设施上,这种进步已经成为可能。这个因素与可以训练这些算法的大量可用数据和易于使用、能够构建人工智能模型的工具结合在一起,构成了推动对人工智能兴趣的主要因素。

人们很自然地会将最近在特定领域的成就延展到未来。一些人甚至将目前的成功延展到深度学习并不是非常有效的领域,造成了很多的误解和炒作。人工智能在学习新概念并将学习扩展到新环境方面的表现仍然非常糟糕。

例如,人工智能系统仍然需要大量的数据进行训练。人类不需要看四万张猫的图像来学习如何识别一只猫。一个人类的孩子可以看到两只猫,然后就会弄清楚猫是什么而狗又是什么——并且能够区分这两者。所以今天的人工智能系统还远不能够复制人类头脑的学习方式。在可预见的未来,这将是一个挑战。

理解自然语言或对话需要大量的人类知识和背景知识。”

沃顿知识在线(Knowledge@Wharton):你会如何将炒作与现实分开?

Saxena大量的炒作来源于对当前趋势的外推,忽略了从研究论文到工程产品中了解一些现实。作为负责使用最新的人工智能技术构建产品的产品经理,我不断尝试将炒作与现实分开。想做到这一点最好的办法是将工程师的健康怀疑与研究人员的乐观结合起来。因此,你需要了解推动最新的、炫酷的人工智能演示的底层技术原理,并且只能推断那些有坚实技术基础的技术部分。例如,如果你了解语音识别方面的改进的底层推动因素,就可以很容易地推断出即将到来的语音识别质量的提升。结合了对自然语言理解现状的健康怀疑,你将能够确定正确的机会,说出在不久的将来,什么样的呼叫中心工作流程将会自动化。

沃顿知识在线(Knowledge@Wharton):对于人工智能来说,哪些是短期内有可能实现的,哪些事情做起来要困难得多?

Saxena正如我在前面所说的,在诸如语音识别等较为狭窄的领域内,人工智能现在比最好的人类更为老道,而在需要推理、语境理解和目标追寻等更为宽泛的领域,人工智能甚至还无法与五岁的孩童抗衡。我认为人工智能系统仍然没有办法很好地进行无监督学习,也没有学会使用非常有限的数据进行训练,或者在没有大量人为干预的情况下进行训练。这些都仍将是非常困难的重要问题。而最近的研究在这些方面也没有显示出多少进展。

Google的工程师Geoff Hinton被誉为深度学习之父,在这里非常合适引用他曾经说过的一句话。我的引用可能不准确,但是这句话大概是这样说的,“深度学习实际上损害了人工智能,因为它让很多人认为它能做一切事情,而我们知道它只能解决种类非常有限的问题。”我认为人工智能仍然面临着巨大的挑战。最近的进展并没有告诉我们何时能够到达那里,或者在近期能够解决这些问题。

沃顿知识在线(Knowledge@Wharton):人工智能是一个覆盖了很多领域的广阔领域,其中的一些领域对非专家来说会感觉非常混乱。例如,你和沃顿商学院的运营、信息和决策教授Kartik Hosanagar于去年四月在沃顿知识在线(Knowledge@Wharton)上发表了一篇关于机器学习民主化的文章。今天,机器学习领域中有哪些正在发生的事情令你印象最为深刻?或者令你最为吃惊?

Saxena令我印象最为深刻的是,有了真正易于使用的工具,人工智能被如此广泛地用于帮助这个世界。所以我们听说过日本农民使用人工智能来分拣黄瓜,把他们的农产品按照好坏区分开来。非洲的一些物流公司正在使用人工智能来安排包裹路径。人们在使用人工智能方面表现出的革新和创意,以及他们表现出的饥渴程度总是令我感到惊讶。即使它在某些方面有局限,人们仍然在使用它并使其有意义。我对于(这种现象)绝对是超级印象深刻。

沃顿知识在线(Knowledge@Wharton):除了机器学习之外,你还有几次提到了深度学习。对于我们很多不是人工智能专家的读者来说,你能否解释一下深度机会与机器学习有何不同?深度学习中最大的突破是什么?

Saxena:机器学习比深度学习要广泛得多。机器学习本质上是一种计算机从数据中学习的模式,并使用学到的模式对新数据进行预测。深度学习是一种特定的机器学习技术。

深度学习的模型是建立在对人类大脑如何学习的推测的基础之上的,并使用了神经网络——这是一种从数据中学习模式并进行预测的分层网络。所以就像人类使用不同层次的概念化来理解一个复杂的问题一样,神经网络的每一层都以分层的方式抽象出一个特定的特征或概念,以此来理解复杂的模式。而深度学习的美好之处在于,与其他的机器学习技术不同,当你为这些技术提供更多的培训数据时,它们预测性能的提升会达到一个稳定的平台,而深度学习的表现会随着数据的增加而不断提高。此外,深度学习已经被应用于解决一些非常困难的问题,并且有非常好的表现,这些问题通常是不可能用其他技术解决的。所有的这一切让深度学习与众不同,特别是对于你可以轻松投入更多数据和计算能力的问题来说更是如此。

沃顿知识在线(Knowledge@Wharton):你能谈谈深度学习中让你印象最为深刻的一些重大突破吗?

Saxena:深度学习是一个激动人心的领域,在过去的两到三年的时间里,出现了许多实验和新技术。在这里会想到两种技术。一个是强化学习,我稍后会解释它。另一个重要的技术是GAN,或者可以称之为生成对抗网络(Generative Adversarial Networks)。

这两者都是突破,因为它们解决了我强调过的一个人工智能的关键问题——如何在没有大量人类监督的情况下学习。所以用大多数外行人士的话说,强化学习本质上是以代理为基础的学习,代理——一个软件程序被赋予一个优化目标,并试图通过多条路径进行优化,并通过从失误或错误中学习来选择最佳路径。是同样的技术带来了机器学习的进步——如何玩视频游戏,例如Atari游戏,或者甚至是像围棋这样更高级的策略游戏。

“例如,在两个人之间安排会面或约见就完全可以交给聊天机器人处理。”

引发了巨大兴趣的另一个重要领域就是生成对抗网络或简称GAN。用外行人的话来说就是,想象有人和搭档一起学习东西。所以我们从本质上来说是有两个神经模型相互竞争和相互教学,互相促进以加快学习进程。GAN在面对被称为无监督学习类别的问题时表现良好——对这类问题,你没有太多的训练数据来告诉机器要学习什么。GAN已经被应用于图像生成和视频变形等方面,并已经取得了重大进展,在未来还会有更多精彩呈现。

沃顿知识在线(Knowledge@Wharton):另一个吸引了很多关注的人工智能领域是自然语言处理,通常会涉及到智能助手,例如苹果的Siri、亚马逊的Alexa或者微软的Cortana。聊天机器人会如何发展,聊天机器人的未来又会如何呢?

Saxena:正如你所说,对于所有的大牌玩家来说,这都是一个投资巨大的领域。这个领域引起了很多的兴趣,造成这种局面的原因有两个。它是人们与机器交互的最自然的方式,只需与它们说话,然后机器就能理解了。这导致了计算机和人类交互方式的根本改变。几乎每个人都认为这将是下一件大事。

尽管如此,这种技术的早期版本非常令人失望。原因是自然语言的理解或处理是非常困难的。你不能仅使用一种技术或深度学习模式——比如说就像你对图像理解或语音理解所采用的方式——解决一切。自然语言理解在本质上是不同的。理解自然语言或对话需要大量的人类知识和背景知识。因为有很多与语言相关的语境,除非你能教会你的代理所有的人类知识,否则它就甚至可能理解不了最基本的东西。

那就是存在挑战的地方。你提到的所有大公司都在这方面投入了大量资金。我看到在一些狭窄的领域取得了一些进展,例如订购比萨饼或解决诸如“我的银行账户快要空了,你可以让我做这个交易吗?”之类的问题。这样的问题有望在短期内得到解决。但是,当你进行更开放的讨论时——想象一下,你的人工智能助手像你的精神科医生一样说话——这些解决方案就要深入得多,因为它们需要更深入地理解人类的知识和情感,而这是人工智能在可预见的未来都缺乏的能力。

沃顿知识在线(Knowledge@Wharton):你觉得聊天机器人的未来会如何?

Saxena当聊天机器人运行在特定的垂直领域和语境之中时,正如我所说的,它可以做得很好。如果上下文是固定的,并且不会改变——而且,更重要的是,用户对聊天机器人的期望是有限的——我认为在这些情况下,聊天机器人会做得很好。

我们看到聊天机器人使用的其他领域就是我们称之为目标导向的对话。例如,在两个人之间安排会面或约见就完全可以交给聊天机器人处理。在这种情况下,上下文是非常有限的,协调两个人的日程安排或者预定餐厅位置。这样就不用人打电话给餐厅进行预约了,聊天机器人可以自动完成这个任务,因为这项任务和语境都非常明确。在我看来,任何超出这个范围的事情都仍然是非常困难的。

沃顿知识在线(Knowledge@Wharton):什么是计算机视觉?它是否有可能使机器以人类的方式理解视频?这个领域最有希望的业务应用是什么?实现它最大的挑战是什么?

Saxena:计算机视觉是理解图像和视频的科学。理解图像的一个例子是识别图像中的对象。视频也是一样的。在视频中,你可以识别你看到的不同的场景以及场景中不同的人和物体。

然后通过关联视频内的不同图像或场景或框架来描述每个场景也是可能的——或者说现在正在变得越来越有可能——人工智能可以观看视频并总结在视频中看到的内容。所有这些都在计算机视觉或视觉理解的范畴之内。

有许多计算机视觉可以应用的领域。计算机视觉的一个有希望的应用领域是监视。我们有能力检测出监控视频中的异常。另一个大的应用是在自动驾驶车辆领域,人工智能让汽车知道道路上有什么,探测物体,然后做出决定,并让汽车据此做出决定。那是另一个大的领域。

“因此,修改视频并对视频进行调整,并让它显得非常逼真的能力将成为一个巨大的挑战,同时也是一个巨大的机会。”

在视频方面,我看到了很大的提升。由于我们理解视频的能力非常有限,因此在今天视频被称为暗数据。但是想象一个机器可以开始理解视频内容的世界。你将在不久的将来看到机器在帮助人们自己生成视频方面的巨大进步。这不会完全自动化的,但是这里的一个风险是创造伪造视频的能力。最近你可能已经看到——这在社交媒体上可是非常受欢迎的——一个奥巴马说假消息的视频。修改视频并利用人类唇形同步技术使得让任何人相信任何事情都变得非常容易。这在这个领域内真的引起了很大的轰动。因此,修改视频并对视频进行调整,并让它显得非常逼真的能力将成为一个巨大的挑战,同时也是一个巨大的机会。它就这样出现了。

沃顿知识在线(Knowledge@Wharton):这听起来真是不可思议。现在,一些大公司正在积极投身于人工智能——尤其是美国的Google、微软、亚马逊、苹果,而在中国则有百度、阿里巴巴和腾讯。创业企业和小公司在人工智能领域有什么机会?他们应该如何增加价值?你如何看待他们在适应更广泛的人工智能生态系统方面的表现?

Saxena我认为大企业和小企业都有各自的价值。大型玩家在这个领域的大量投资是建立平台,而其他人可以在这些平台上构建人工智能应用程序。人工智能领域的几乎每一个玩家,包括Google在内,都创建了可供其他人构建应用程序的平台。这与他们为安卓或移动平台所做的事情类似。一旦平台建成,其他人就可以在平台上构建应用程序了。所以要聚焦在哪里非常清楚。显然,对于创业企业来说,在使用这些大型玩家创建的开放源代码工具构建应用程序方面有着巨大的机会。

创业企业还将继续发挥作用的第二个领域就是我们所谓的垂直领域。人工智能进步的很大一部分来自于好算法和专有数据的结合。即使是Google和其他的大牌玩家拥有最好的工程人才和算法,他们也没有数据。所以,例如一家拥有专有医疗保健数据的公司可以创建一个医疗保健人工智能创业企业,并与大公司展开竞争。金融或零售等行业也是如此。

沃顿知识在线(Knowledge@Wharton):在人工智能领域,你能举出一些取得卓越成绩的创业企业的例子吗?他们的工作为什么很重要?

Saxena在以人工智能为中心的初创企业中,并没有出现多少突破性的成功。当我说突破性成功的时候,我的意思是指数百万美元甚至数十亿美元级别的创业企业。全球有很多有前途的创业企业。例如,在客户服务领域,我看到创业企业做得很不错。在人力资源自动化领域,我也看到了一些不错的创业企业。

沃顿知识在线(Knowledge@Wharton):在未来的12至24个月内,每个人都应该注意的三大人工智能领域是什么?为什么?

Saxena我认为机器人与人工智能的结合将是非常有趣的。机器人长期以来一直在采用的广泛程度方面令人失望。这是我认为的一个领域,机器人和人工智能的结合将是非常有趣的一个领域。你会在这个区域中看到一些值得注意的应用。有了自然语言理解和视觉理解的发展,当然还要加上机器人的进步,和人类更加相似的机器人将是一个很大的领域。这是一个我一定会关注的领域。

自动驾驶车辆也是一个重要的领域。在接下来的几年中,我们将看到自动驾驶车辆的商业部署。

我看好我们将在视频理解中看到的一些进步。视频理解与虚拟现实的结合可以创造出一些有趣的突破。 这是我们应该继续关注的另一个领域。 我看到的共同主题并不是特别的人工智能,而是人工智能同其他一些领域结合在一起。这可以在不久的将来创造出一些引人入胜的用例。

分享至
0赞

好文章,需要你的鼓励

推荐文章
----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.-