聊天机器人太蠢!Winograd挑战暴露智商
2016-07-16 09:07:00 来源:中关村在线(北京)

(原标题:聊天机器人太蠢!Winograd挑战暴露智商)


第1页:歧义句真假难辨

自从聊天机器人出现以后,我们便产生了一层担忧,会不会太聪明了?会不会取代人类的部分工作啊?会不会代表人工智能侵略地球啊?一项最近的比赛证明,现在的这些聊天机器人依然稚嫩,虚拟助手需要走的路还很长。


聊天机器人太蠢!Winograd挑战暴露智商
智能语音助手没那么智能

难辨李鬼和李逵

“Siri,给我叫辆救护车。”“好吧,从现在开始,我叫你救护车。”

这并不是个笑话,2011年,苹果刚刚推出智能语音助手Siri之后便遇到了这一问题。虽然在不久后苹果修复了这一问题,但是一个新的证据表明,智能语音助手依然缺乏常识,很难避免发生这样的尴尬事件。

聊天机器人太蠢!Winograd挑战暴露智商
Siri趟过的雷区依然是雷区

这个新的证据来自于纽约的一次学术会议。会上,有人提出了应当采用一定的办法,对智能语音助手的真正智能化程度进行测试比赛。

这次的测试比赛被称为“Winograd模式挑战”。测试者会对电脑挑选一些有歧义的句子进行提问,而这些句子的组成构架需要一些常识才能够理解,比如“比如南海是属于中国的,他们无法抢走。”这里的“他们”就需要一定的背景理解才能得知指代为何。

聊天机器人太蠢!Winograd挑战暴露智商
我说1,你理解的却是0

而比赛结果则可以让人们安心了,最强的两款被测试程序正确率分别为48%和45%,正确率均未达到一半。根据比赛规则,如果参赛程序的正确率达到90%,将有资格拿走25000美元的大奖。值得注意的是,测试结果最好的作品是来自于中国科技大学的刘泉。

而根据纽约大学的心理研究顾问盖瑞·马库斯的说法,这次的结果并不足以为奇,因为当前的智能程序几乎没有更好的机会获得突破。让电脑学习常识性知识是十分困难的事情,如果而让计算机通过文本统计分析等方式来了解世界是困难重重。进行手工编码学习知识,耗时过大基本无法完成。

不过值得注意的是,这次的比赛谷歌和Facebook这两大巨头并没有参加,而且这两家公司的研究人员都曾经表示在自然语言理解方面取得了重大进展。不过在马库斯看来,即便这两家公司也不太可能让计算机做到100%完成这次挑战。


第2页:机器学习有帮助,但未根除问题

机器学习的帮助

这次的比赛并不只是为了衡量人工智能的进程。主办方也希望借此次比赛让更多人注意到,建立一个可以直观、强大、可从文字语言中获得更多信息的聊天机器人依然有很多困难。


聊天机器人太蠢!Winograd挑战暴露智商
机器学习很重要,但并非万能

在谷歌、Facebook、亚马逊和微软等科技巨头中的研究人员,一直都在关注语音方面的问题。他们所使用的普遍为最新的机器学习技术。这其中神经网络的深度学习尤为关键,可以帮助开发更智能、直观的聊天机器人或者智能助手。

而事实上,随着聊天机器人和语音助手普及率越来越高,在图像和语音识别领域已经取得了很大的进展,普通用户来讲,他们已经可以理解的很好了。但事实上,在此次比赛中能够取得优秀成绩的参赛者也都是应用了机器学习的方法。

而据刘泉称,此次他们所采用的系统还存在一个问题,如果这个问题解决后,其准确率应该可以达到60%。但是主办方认为,即便是这种说法是真的,其准确率依然比普通人类要差很多。

聊天机器人太蠢!Winograd挑战暴露智商
阿兰·麦席森·图灵

1950年,阿兰·麦席森·图灵设计出一个测试,如果电脑能在5分钟内回答由人类测试者提出的一系列问题,且其超过30%的回答让测试者误认为是人类所答,即为通过,这就是著名的图灵测试。2014年,应该一个计算机程序成功的让人认为他是一个13岁的男孩,通过了图灵测试。

于是人们发觉图灵测试以及不适应现在的时代,便发明了更具针对性的WinogradSchema挑战,即选择一些更具迷惑性的问题让计算机程序进行回答。

聊天机器人太蠢!Winograd挑战暴露智商
聊天助手,路还很远

马库斯还表示,在未来的智能家电、可穿戴智能设备会越来越多,这一问题是我们必须要面对的问题。如何解决这一问题会是人工智能下一阶段发展的重点。

  • 为你推荐
  • 公益播报
  • 公益汇
  • 进社区

热点推荐

即时新闻

武汉