专访微软邓力:人工智能发展迎来好时代
2016-09-15 08:30:00 来源:中关村在线(北京)

(原标题:专访微软邓力:人工智能发展迎来好时代)

近年来,随着计算能力的提升,以及相关科学技术的成熟,人工智能逐渐开始由尖端化走向平民化,尤其是不少消费类智能产品的推出,更是将“人工智能”这个在过去看来颇具科幻色彩的名词直观呈现在了普通大众面前。

然而,在人工智能平民化的今天,其背后相关的技术,如深度学习、语音识别、图像识别等等已经达到了怎样的程度?人类是否最终真的无法凭借人脑计算战胜机器计算?科学家们为人工智能的发展都做了哪些努力呢?

带着这些问题,我们采访了IEEE会士、微软人工智能首席科学家邓力博士。

1999年,邓力博士正式加入微软雷德蒙研究院。2016年,他正式被任命为微软人工智能首席科学家。直至目前,邓力博士作为深度学习技术中心的合作研究经理,负责深度学习领域的技术创新。他的主要研究领域包括:深度学习、自动语音识别、机器翻译、自然语言处理等。

在加入微软研究院前,邓力博士曾于加拿大滑铁卢大学任教,于1989-1992年期间聘任为助理教授,1992-1996年为副教授(终身教职tenured),1996-1999年被评为该校正教授。自2000年起,他还获聘为美国华盛顿大学特聘教授及研究生委员会成员。邓力博士持有美国威斯康星大学硕士、博士学位,中国科学技术大学本科学位。


专访微软邓力:人工智能发展迎来好时代
IEEE会士、微软人工智能首席科学家邓力博士接受专访

我们的专访正值CCAI2016(中国人工智能大会)期间,邓力博士在做完主题为《驱动大数据人工智能多种应用的三类深度学习模式》的报告之后,接受了中关村在线编辑的专访。

·人工智能发展处于健康状态

邓力博士长期生活在美国,但从对他的采访中可以看出,他对于中国人工智能的发展虽然不如像对美国了解那么多,但通过本次CCAI期间的交流以及每年两到三次的定期回国工作,邓力博士对于中国人工智能的进展已经有了一个相对全面的了解。

同时,邓力博士也认为,无论是中国还是在全球范围内,人工智能领域正处于一个比较健康的发展状态。在问到这其中的原因时,邓力博士说:“这其中很大原因在于近五年来技术逐渐成熟,可以迅速处理庞大计算量的数据。同时大家对这一方面,特别是深度学习的理解,对深度学习的成功有了越来越大的信心。此外工业界、学校等机构都对这一方面的研究投入的越来越多。很多原来的一些瓶颈现在已经被慢慢的打破,所以我觉的现在确实是走上了一个非常健康的道路。”

·邓力博士自身的研究方向是什么,与以往有没有差别

邓力博士曾经对增强学习的算法有深入研究,而现在的研究方向和之前有没有什么不同呢?

邓力博士介绍说:“有,大约是七八年前,我开始做有监督的深度学习,当时由于GPU/CUDA的到来和有标注语音大数据的储备,使得神经模型做的越来越深。而且有监督的深度学习让我们当时知道随着有标注数据的增大,反向传播这个算法可以做的越来越好。然而差不多两三年前,那个时候我们受到一些启发,就感觉到这个增强学习的前景已经到了,之所以到的原因是什么呢?以前我也有研究过增强学习,当时还没有深度学习算法,所以增强学习的表征能力是非常弱的,比如说像象棋的状态空间是非常大的。那以前就是使用浅层的表征方法,通过线性的方法来表征复杂的状态,之后再用增强学习的方法。这样的结果非常不好。增强学习本身并没有问题,主要是以前方法的表征太差了。”

邓力博士接着说:“而现在使用了深度学习的方法,把那么大的状态映射到有好几层的深度神经网络上,并且这些网络输出端负责不同的操作指令。就好像一个游戏机的12个控制指令,12维的动作空间,成为增强学习中的12维动作空间。随后我们团队立即就做了很多这个方面的工作在几种不同领域的应用。从高层来讲,我们把这个方法用到人机对话上,这是我们团队现在的重点工作之一,因为微软已经将“对话即平台”作为一个战略方向。”

·不同领域的深度学习本质上一样吗?

时下,无论是智能机器人领域,还是自动驾驶等诸多领域,大家都在讲深度学习的应用,那么从算法,架构、技术等方面来说,不同领域的深度学习本质上是一样的吗?

对这个普通大众都关心的问题,邓力博士给出了明确的回答:“从理论上来讲的话是一样的,因为都使用一个引擎,一个深度学习引擎理论上其实可以解决所有的问题。但是在目前实际上来说还没有能够达到(一个引擎解决所有问题),所以在不同的应用上我们还需要调试一下深度学习模型的结构。在算法方面其实基本都一样,就是反向传播算法(backpropagation),只是它在不同领域应用的不同,其实是表现在建模的时候也要考虑数据的性质。比如说语音的模型,它有时序的关系,但图像的模型没有时序的关系,而具有空间上的不变性特点。那么最终的结构就会有所不同。除了结构不一样之外,基本的学习原理几乎是差不多的,也就是学习的方法是一样的,但模型的结构存在差异。”

邓力博士进一步深入的解释到:“比如如果做自然语音处理的话,那么做语音识别方面的某些结构就有可能需要剔除掉。所以这个目前还不是很理想,理想的状态应该是通用的方法、通用的结构,只需要一个引擎就能解决所有问题。目前来讲我们还无法做到,这个就是通用人工智能和局部领域人工智能的区别,我们现在处于局部领域的人工智能阶段,并且已经处于中级的局部人工智能阶段,只有局部人工智能做到非常成功,我们才能够做到通用人工智能,所以还是有很长的路要走。”

“其实我们做研究的话都是在往广义、通用的人工智能上去做努力,比如说把深度学习的方法运用到一个人工智能应用上面,我们总是想着怎么样把它做的更一般化,比如说算法就不能说太针对某个应用,如果太针对某个应用的话,我们就会离通用人工智能越来越远。”

“那怎么来做呢?比如做图像识别的话,目前最成功的方法叫做卷积神经网络(ConvolutionalNeuralNetwork),但这个方法在其它领域就不见得那么好;而在语音识别上呢,我们一般来使用有序列特性的神经网络,所以不同领域还是会有所不同的。但是如果模型的结构定了之后,基本的学习方法应该几乎是相同的。”

·深度学习方法会不会取代其它的机器学习方法

机器算法在不断的革新和进化,那么深度学习会不会取代其它的机器算法呢?

邓力博士给出了答案:“是的,其实在很大程度上已经取代了其它机器算法,比如原来我们在语音识别上使用的是隐马尔可夫模型(HiddenMarkovModel),然后还会用一种叫做高斯混合模型(GaussianMixtureModel),然后我们最早在在2010年左右,是用深度神经网络取代了高斯混合模型,但深度神经网络没有时间的测序,所以我们当时是把隐马尔可夫模型结合在一起,所以我们大概在不到一年的时间里就把产品做了出来。最近几年我们开始利用LSTM这种有时间序列的神经网络来取代隐马尔可夫模型,所以现在从头到尾都使用的是深度神经网络。这个神经网络里包含了时间、空间以及各种各样的性质,从而可以适应图像、语音等不同方面的应用。”

·人工智能与深度学习的发展状态是怎样的?

近年来人工智能、深度学习的发展状态是一种加速发展呢?还是一种稳定的渐进式的发展态势?

对于这个问题,邓力博士回答说:“我觉得最近的发展还是非常快速的,比以前要快的多。比如当时引用深度神经网络取代隐马尔可夫模型的时候,那是一个非常快的过程,可以形容为一招制敌,直接把错误率降低了30%,后续用LSTM又降低到了50%,但从那之后又慢慢开始放缓下来。而我觉的下一个突破应该是要去解决一个非常根本的问题,这也是人工智能发展的一个非常根本的问题,那就是说怎样克服现有的有监督学习的局限。现在主要的局限在于说你要训练大型的神经网络,你必须要有大型的数据做支持,并一定要匹配好输入、输出数据,这样才能够训练大型的神经网络。我们刚才讲的反向传播算法(backpropagation),它就需要进行匹配,不匹配好的话你就不知道怎么去训练。”

“那么我觉得下一步方法就是要怎样把超大数据输入、输出做到不需要匹配,不需要匹配的话就有取之不尽用之不竭的数据资源,也可以省下大笔成本去标注数据。比如说我现在接受专访对着麦克风录音的这些数据,在语音识别上是用不上的,为什么用不上呢?除非把我说的每一句话都写出来作为标注,这样才能用上语音数据,但这样明显是不实用的。所以现在大家可以看到很多大公司在做而小公司没法做,是因为大公司有这个钱去雇佣一些员工把这些语音信息“写”出来,虽然不是全部需要这样做,同时也会有可能有一些错误,但毕竟这是需要人力来完成的。而我们所做的工作就是希望在将来把这一部分的费用能够省掉。我可以有好多的输入和输出,但是不一定要把每一个句子都写出来才能输出,这个关键问题如果能够解决的话,接下来就会有很大的突破,但现在研发的速度没有那么快,因为像这样做的话需要的数据量会更多。”

邓力博士接着说:“这个就叫做非监督的深度学习,输入和输出不一定要匹配起来就能实现大型神经网络的训练。不过现在无论是计算量还是计算能力都还达不到要求,比如说五年后当这些条件都成熟了,那么就必然会迎来又一次突破,所以人工智能的潜力空间还是很大的。”

·关于小冰、小娜

邓力博士是微软人工智能首席科学家,他对于小冰、小娜这两个与大众接触最多的人工智能应用有怎样的看法呢?

邓力博士说:“其实小冰和小娜本身的定位不太一样,小冰的交谈能力更强,小娜的功能性更强。比如你跟小冰说要吃饭,小冰可能会给你一个人性化的回答,但却不能为你推荐餐厅或订餐,而小娜则能够做到这些事情。所以我们最终是希望把这种不同方式的人工智能整合在一起,使其既具备功能性,又能够有人性化的特点。现在深度学习其实有点更偏重于IQ,在EQ方面还是有所欠缺。所以怎么把EQ和IQ整合在一起,也是一个很好的深度学习方面的研究课题,我们也在探索当中。”

·关于AlphaGO大战柯洁

AlphaGO可能会与人类目前棋力最强的选手柯洁再次进行人机大战,那么人类最强围棋选手有能力战胜机器吗?人类通过人脑的计算是不是很难战胜机器呢?

对于这个问题,邓力博士回答说:“我个人的感觉是柯洁可能会取得一部分胜利,但最终还是机器会赢。因为下棋对于机器来说是一个很简单的问题,机器可以罗列出无限大的可能,再把它迅速缩小,判断哪些步骤是能够取得高胜率的,而且对于机器来说,它可以轻松做到比如300步以上的推算,而人类的话可能做到100步就是难以突破的极限了,同时机器还可以用算法去预测出多少步可以获胜,这是人类所难以做到的。此外,人类的积累速度远远比不上电脑的速度,所以即便开始的时候因为算法出现问题能够让人类选手获得一些胜利,但人类的发展远远比不上技术的发展速度,比如人类棋手在围棋学校学习很长时间才能达到一定的成就,而机器利用深度学习可以在几天、几个月之内就达到很高的水准,所以到最后还是机器会获得胜利。”

·人工智能的高速发展会在未来取代很多现有的职业吗?

对于大众而言,较为担心的一个问题是,当人工智能高度发展之后,会不会取代现有的很多职业或工作?

邓力博士说:“当然会有一部分被取代,但我觉得这对于人类社会效率的提高也是很有益处的。交给机器去做一些人类不擅长或者枯燥、疲劳的工作,这比人类自己去做肯定会有更高的效率,但同时,人类可以从中解放出来去做更多有意义的事情。比如说开车,现在去较远的地方需要开很久的车,或者开夜车,人也很疲惫,未来人工智能高度发展之后,自动驾驶取代人类驾驶员,就能够减少疲劳驾驶导致的事故,还可以让人在长途旅行中得到很好的休息。”

·人工智能研究落实到应用层面是否考虑到是取代一些对于人类而言无意义的工作?

人工智能的研究方向最终落实到应用层面的时候,就现有情况来看,如扫地机器人等,都似乎是在取代一些对于人类而言没有太大意义的工作,那么对于人工智能的科学家们来说,是否有这样的考虑呢?

邓力博士说:“我觉得真正做人工智能研究的话,是没有直接去考虑这个层面的问题的,我们只是在想如何把这个技术做出来,最终如何应用还是需要企业去做决定。比如最近有个新闻是有团队做了一个写电影脚本的人工智能,写完以后演员们觉得不错,就拍了电影,还送到科幻电影节去参赛,最终获得了第10名,但他们在研发的时候并没有想过要取代编剧,而只是专注于技术的研发层面,技术对于我们来说还是最重要的。”

·智能机器人产品现阶段给人一种很LOW的感觉?

目前,智能机器人产品辨识度对于大众而言还不高,因为很多所谓的智能机器人产品就像是蓝牙音箱、平板电脑加上了智能语音、图像识别系统,让人感觉并没有想像中那么高端,对于这样的情况,邓力博士是如何看待的呢?

“其实这些机器人也不能单纯的就说它不高端。毕竟人形机器人制造成本非常高,但是我想最终智能机器人能够被应用在一些有意义的领域,比如说能够帮助人们照顾老人,能够实现比如帮老人开冰箱等更高一些的功能的话,那个时候可能企业会投入更多的钱去把它做的更好看、更高端,而现在大部分机器人还没有具备太高的实用价值、相关技术也没有非常成熟,所以现在看到的那些辨识度不够高的机器人,其实是一种现实状况的反映,你如果花费很多的资源去把它做的很好,但又没有什么实用价值,这其实是并没有什么实际意义的。”

  • 为你推荐
  • 公益播报
  • 公益汇
  • 进社区

热点推荐

即时新闻

武汉