4月29日,2016全球移动互联网大会(GMIC)昨日在北京-国家会议中心开幕。微软亚洲研究院常务副院长芮勇在接受腾讯科技的专访中表示,AI技术一直在螺旋式前进,距离超越人类的大脑还有很远的距离,希望业界对这个技术的发展趋势以平和的心态看待。
今年是“人工智能”这个词被发明出来的第60年。过去60年里,人工智能经历过两次春天和冬天。第一次春天源于AI概念的产生,彼时业内人对很多技术怀有不切实际的期待,认为包括自然语言处理这样的问题在五到十年内都可以解决;而第二次春天则发生在十几年前,第五代个人计算机、专家系统等等概念的出现,又让人工智能火了一把。
“现在是第三个春天,其实人工智能一直在以螺旋的方式前进,希望大家对此有平和的心态”,芮勇说。
而对于AI与人类的碰撞,芮勇的观点现在还无需到恐慌的时候,接下来是人类和机器共存的年代。AI在计算和记忆能力上已经超过了人类,“但凡是有规则的事情,机器超过人类都是时间问题”,但人类的右脑——那些产生想象力和艺术创造的部分,是目前机器无法做到的部分。
“人对自己的理解还很肤浅。今天我们能够上太空、下海洋,但是对人类自己大脑的理解是很皮毛。有一天对于自己的了解能够再向前发展的话,可能这个瓶颈会稍微小一点,但是那一天真的还很远”,芮勇对腾讯科技说。
芮勇在今天的主题演讲中也提出了“5个AI”的概念,除了人工智能之外,还包括聚合智能、自适应智能、隐形智能和增强智能四个技术概念。而微软最新的产品HoloLens,也在“隐于环境的智能”技术基础上,提出了包括医疗、建筑和工业设计、城市规划等等更多的应用场景。
“我想我们今后谈的话题是人类+机器,人类利用人工智能很强的东西,使得我们人类变得更强”,芮勇说,“这会是第五个AI。”
以下是专访实录:
腾讯科技:我们先从大家最感兴趣的HoloLens方面开始聊,您刚才在会上介绍了很多HoloLens未来的应用场景、工业设计、医疗等等。但是如果想要这些场景成为现实,我们现在的AI技术还需要发展到什么程度?我们现在大概做到了什么样的程度?
芮勇:还是有很多技术要去进一步开发,比如说像三维视觉的重建,比如像物体的扫描等等,还有很多的技术。今天做到了什么程度呢?大家也知道微软公司是在今年的上半年会出开发者工具包,我觉得等开发者工具包出来之后很多第三方的发烧友、开发者就可以在上面开发自己想要的一些应用。
腾讯科技:这个工具包现在是还没有推出来?
芮勇:应该是今年的上半年。
腾讯科技:是基于HoloLens的工具包?
芮勇:是的。其实上我们的官网都可以看到,那里有准确的信息。
腾讯科技:您今天也提到了今年是人工智能这个词被创造出来的第六十年,这六十年当中您觉得发生过哪些比较有标志性的,或者可以称之为节点的事件呢?
芮勇:非常非常多。首先人工智能有很多的分支,有计算机视觉、语音识别、机器学习等等各个方面。从大的趋势上,其实有两次起起伏伏,有春天,后来又冬天,又有春天和冬天,现在是第三次春天了。我很希望媒体界的朋友也帮助一下做科研和做产业界的朋友,现在不要把期望值设得太高,因为原来的两次冬天的来临就是因为两次春天期待能到很高,但其实只能在这儿。我们要以平和的心态去面对人工智能各种技术的发展,有很多好的技术但是不要过于扩大。在这个过程当中有很多划时代的一些故事和一些算法,简单提一提微软自己做的一些,很有意思的事情。
我刚才在演讲里面也略提了一下,一个是计算机视觉。计算机视觉是你拿一张图片给计算机看,计算机可以识别出这个图片里面包含什么物体,这个物体在什么地方,以及精确到像素属于什么物体,这还是做得非常了不起的,几乎可以跟人的水平一样了。
第二个是Skype Translator实时语音翻译技术。比如说你只会说法语,我只会说中文,咱们俩怎么交流呢?必须要有一个大的技术做得非常好,语音的识别、文本校正,实时的机器翻译,以及TTS语音合成。这些串联在一起才能成为可以用的系统。因为我也有参加过其中的一些工作,我觉得这还是非常值得骄傲和激动的一件事情。
腾讯科技:您刚才提到了两次春天,这两次春天大概是发生在什么时候,契机是什么呢?
芮勇:第一次春天是因为这个词造出来不久,人们觉得人工智能太厉害了,有人预言五到十年后很多事情就可以解决了。春天的意思是政府、企业也好都投入了很多钱,但是后来发现这个问题远比我们想象得复杂得多。举个例子,大家觉得语音识别是五到十年就可以做成了,但是五到十年后发现还需要五到十年,直到2009年、2010年前后深度学习出现之后,才把原来很难降下去的错误率一下降下去了30%,因为新的算法出来了。第一次冬天是你说能做好,结果没有做好,所有的政府把所有的资助都停了。
第二次春天也是十好几年以前的事情了,那时候有一些像专家系统、国外的第五代个人计算机等等,又是有一套东西起来。但是后来泡吹得有点大,所以又有了冬天。
所以在第三次春天来的时候,希望借助媒体的力量呼吁大家有平和的心态。其实过去的六十年人工智能一直是在前进的,只不过外界对它的印象是在春天和冬天,其实一直过的是秋天而已。
腾讯科技:这60年人工智能是这样稳步上升的曲线吗?
芮勇:也不是稳步上升的,是螺旋式上升,因为还是有几个台阶的。中间有神经元网络的出现,有符号推理的出现,有动态贝叶斯网络的出现,有专家系统的出现,最近最热的是深度学习的出现,还是有几个台阶的,不是很平滑的。基本上是螺旋式上升的,不是说一个谷一个峰。
腾讯科技:大家最近很关心围棋,可能也是春天的契机。从您专业角度看,机器战胜人类的事情是里程碑吗?还是比较自然的事情?
芮勇:从两个方面来讲,第一是有强人工智能和弱人工智能之分,弱人工智能是把某一件事情,尤其是一些有规律、有规则的事情给实现,让计算机进行实现,这就是弱人工智能。不管是下围棋、跳棋、国际象棋等等基本上是属于这一类的范畴。这一类的范畴,慢慢的人工智能都会超过人类,其实不超过人类才是很奇怪的事情。
另外一类是强人工智能,强人工智能是全面的把所有事情都做好,而不是只会下棋、倒一杯咖啡,是要全面超过人类,这个还要有很远的路要走。我们可能要区分一下弱人工智能和强人工智能,弱人工智能方面会有很大的发展,强人工智能还有很远的路要走。我有点担心,大众有时候会把强人工智能和弱人工智能混淆在一起,这是第一点。
第二点,每个公司有每个公司发展人工智能的不同角度和看法,有的公司是去做一个象棋,有的公司说做一个围棋或跳棋。微软公司对棋类不感兴趣,我们想把过去二三十年在人领域各个方面的研究成果,比如说让机器像人一样可以看到外面的世界、听到外面的声音,以及像人一样去思考和推理,把二三十的研究成果做在智能云的服务上面,使得第三方开发者不用花二三十年去做这样的事情,而直接调用一个API就把这个事情做了,所以各个公司对人工智能的看法不一样。
腾讯科技:但凡是有规则的事情机器都会超过人类。
芮勇:就是时间的问题,不超过人类是很奇怪的事情。
腾讯科技:人工智能有很多分支,微软选择这些分支来做的理由是什么?
芮勇:2016年是人工智能这个词被造出来的第60年,也是微软研究院成立的25周年。25年前微软是很小的公司,1991年的时候微软并不大。当时比尔盖茨先生是很有远见的,希望今后的所有计算机能像人类一样去看到、听到、说话以及思考。在我们1991年的时候就决定成立研究院做基础科研,最早的几个方向刚好是人工智能几个大的分支,包括计算机视觉、语音识别、机器学习、自然语言处理,当时就有这样的愿景希望计算机像人类一样。
腾讯科技:在中国或亚洲有什么侧重点吗?
芮勇:我们有几个侧重点,微软亚洲研究院至少有四个大的侧重点,第一个是在人机交互方面。为什么我们一定要用键盘、鼠标,人和人交流的时候是用语言和手势,更好的交流方式在哪里是一个方向。
第二是跟多媒体的分析和理解是有关系的,比如说音频、视频的压缩、传输、理解、搜索、分享,我觉得这也是非常重要的一个方面。
第三是对大数据的挖掘,对一些大数据的分析,对一些人工智能本身算法进一步提升成新的算法。比如说有没有办法做成152层这么深,不是什么人都可以做这么深的,怎么去做,初始化条件在哪里,中间的结构跟原来是不是有不一样,这是一块。
第四是我们还做一些跟整个计算机领域最基础的科研有关系的东西,比如像操作系统、分布式计算等等,我觉得这是微软亚洲研究院比较专注的四个大的研究方向。
腾讯科技:您刚才提到AI在计算能力上已经很强了,但是有可能发展出来创造力和想象力吗?就是发展出创造力或想象力的瓶颈在哪里?
芮勇:我个人觉得发展出像人类一样的创造力和想象力,我觉得可能还很远、很远。就以下棋来举例,下棋其实不是人工智能打败了一个人,而是一批很聪明的人加上了一个很强大的计算机打败了另外一个人,因为那个程序是我们人写的。如果有一个计算机程序写出来另外一个计算机程序打败了人类,我觉得这是创造力。或者把计算机放在一棵苹果树底下,一个苹果砸在计算机上它想到了这是万有引力,这个叫创造力,但在这个之前我们说的还都是弱人工智能。
腾讯科技:所以瓶颈在哪里?
芮勇:因为我们完全不知道人类的意识或创造力,人对自己的理解还很肤浅。今天我们能够上太空、下海洋,但是对人类自己大脑的理解是很皮毛。有一天对于自己的了解能够再向前发展的话,可能这个瓶颈会稍微小一点,但是那一天真的还很远。
腾讯科技:瓶颈其实在人类对于自身的了解。
芮勇:对,在对自身的了解。
请输入验证码