马化腾对话李彦宏:百度在人工智能走得更前,腾讯还是落后
发布于 2017-04-05 09:58 2288 次浏览 0 赞 来自 随便聊聊  

4月2日的IT领袖峰会上,马化腾和李彦宏两位工程师出身的IT领袖又碰面啦。这次的主题是:“在人工智能时代,我们是怎么挖微软研究院的人?”

这当然是一个玩笑,这次对话的主题是《人工智能:中国机遇与挑战》,对话四方包括百度CEO李彦宏、腾讯CEO马化腾、微软公司全球执行副总裁、微软人工智能及微软研究事业部负责人沈向洋,还有神州数码控股董事局主席郭为。

不过,随着几大巨头的人工智能布局逐渐深入,确实他们对人才的需求也越来越多,向来被业界称为“国内科技圈的黄埔军校”的微软研究院,继续担任人才的输送中心,在现场,三位来自微软、百度和腾讯的高管,也就此事调侃起来。

马化腾还说,腾讯在西雅图建了一个研究院,因为微软的很多研究人员不愿意离开西雅图。沈向洋也说,微软人工智能事业部有七千多人,但还在不断招人,因为百度和腾讯一直在挖他们的人。

看来,小马哥也是越来越重视人工智能了,最近腾讯的围棋AI“绝艺”,也因为赢得了日本的围棋大赛爆红,而且跟阿尔法狗的负责人黄博士不同,腾讯做绝艺的团队,没有一个人懂围棋。所以主持人也问起了小马哥,腾讯为什么重视人工智能?

马化腾首先非常谦虚地说,其实百度在人工智能走得更前,腾讯还是落后。不过他认为,不仅是腾讯,其实在内部,大家都在结合自己的业务去AI的研究和应用,比如腾讯在微信中大量的人脸图片识别,媒体广告的精准匹配。

一年前,Google阿尔法狗的论文出来的时候,腾讯的团队也开始去探索,后来Deepmind的论文出来之后,也有很多公司用了深度学习。他说,绝艺的成长,不同的在于,它一直得到了很多国家级棋手的支持和陪练,也得到了很多国家级专家的支持。“虽然今天绝艺确实获得了一点小成功,我们不能太欣喜,毕竟是站在别人的肩膀上的,如果这个论文没出来我们也做不出来。”

他还说,人工智能的可怕之处在于,它可以利用后台的云计算,自己不断地快速学习,现在阿尔法狗可能对围棋的理解已经超越了人类。未来,就像开车,你可能不需要教他怎么开车,只需要做一个模拟器,让他自己在无数次的撞车中得到反馈,自己学习,我认为这个是值得我们思考的。

同时主持人也问李彦宏,为什么会那么早开始布局人工智能?

按李彦宏的说法,这就跟百度做搜索很有关系了。他说,百度从基因上来说,就是在做搜索,其实本质上就是一个机器区揣测人的想法的事情。他回忆,大概是在2011年,那时陆奇还在微软,他告诉李彦宏,微软的深度学习部门已经发展到可以应用的阶段了。

百度自己也发现,深度学习在图像检索里效果很不错,他开始在思考,这究竟是一个仅仅在图片搜索这个垂直领域,还是一个趋势。他觉得它是代表一种趋势的,对很多其他计算机科学要解决的问题都是非常有用的,因为随着互联网这么多年发展,数据越来越多,越来越丰富,计算资源越来越便宜,越来越强大。他也知道,人工智能发展五十年前,一直没有人看好,其实当年他在美国读书的时候,很喜欢人工智能这门课,但是教授告诉他,学这个找不到工作。不过,后来他们慢慢发现,原来以为没有用的东西,后来有用了。

因此,他说自己食言了。本来他认为,作为一个商业公司,百度不应该去做研究院,应该去跟产品和应用部门紧紧结合。可是人工智能不一样,它需要长远的布局,所以百度开始组建研究院,吸引和招募人才。

不过说到人工智能的发展,还记得就在这场高端对话之前,马云才提出了一个观点,认为不应该讲Artificial Intelligence,应该是Machine Intelligence,现在的人工智能,都是在模仿人脑如何工作,但实际连人类自己,对人脑的了解和开发都不超过3%。机器应该拥有自己的独特的思维方式,而不是永远模仿人类怎么工作,只有这样两者结合起来工作,才会发挥更大的作用。

于是,主持人也观察到,比如机翼、雷达也好,这些都是一些仿生的设计,甚至是现在深度学习的神经网络。就此,他问了几位IT领袖一个问题,他们认为人工智能是模仿人脑或者仿生,还是要拥有全新的思维方式?

小马哥说,我们当然是希望有一些新的东西,但现阶段,还是应该务实点,现阶段还是通过仿生的阶段,在某一些垂直的领域尝试,要做一个通用的AI非常难,包括围棋也是选一个非常窄的领域,甚至一旦规则变了,几乎就要重新训练,之前的训练全白费了。

李彦宏则并不同意,现在的深度学习是在仿生,因为“其实我们也不知道人脑是怎么工作的,怎么去模仿呢?神经网络只是为了让大众更明白研究人员在做什么的一个比喻。”不过,他确实认为,深度学习只是在很初步的阶段,我们要达到人脑的程度,还要很久很久。他还解释,其实这个很久的意思,我认为是永远不可能的,甚至像之前以为一位演讲嘉宾朱民说的,将人工智能分成三个阶段,弱人工智能到强人工智能,再到超级人工智能,第二个我都觉得不行,永远不可能。

沈向洋很赞同李彦宏的观点,他认为,目前脑科学的发展还很初级,限制了人工智能的发展,计算机冯·诺依曼的结构,跟人脑的结构本来就完全不一样。他相信,随着人工智能发展,未来会有越来越多学计算机的人去做研究脑科学。

最后,我们都知道,人工智能之所以在今天快速发展,有三个基础:海量数据、强大运算能力和深度学习的发展。

在中国,掌握着最大数据量的,莫过于BAT了,百度做不少开放平台,主持人突然就顺势小马哥,你们腾讯有那么多社交数据,有没有可能把数据分享出来,让创业公司用?

马化腾依然回答得非常实在,他说,“这个问题我们在内部也有激烈的争论”,场景对于研究确实很重要,很多研究都需要实际运转数据的支持,不过,不是有一堆数据就能用,数据还需要清洗和标签化,才能让AI去学。这是一个非常庞大的工作量,甚至还是需要人去用很笨的方法打标签。运算能力对人工智能也很重要,需要用云的资源,所以腾讯也在做云。

更紧缺的,就是人才了,他说,一年前腾讯也很缺人才,如今逐渐招募了不少。为了招贤纳士,腾讯还在西雅图也设立了一个实验室,“因为很多微软的人都不愿意离开西雅图,因为我们就在旁边设了一个研究院”。

设立了研究院之后,腾讯内部也在问各个业务线,数据能不能给研究院做研究用,但是,其实业务部门本身,也希望能招人去处理和挖掘利用自己的数据,而不是全部分享给别人。因此,即便单论公司内部,也会有这个问题。

第二个则是用户隐私问题,因为腾讯的社交数据涉及大量用户隐私,如何脱敏是个很关键的问题,要清洗到什么地步才能用,还要看看。最后他总结,数据的标签化和清洗,业内也有很多人也都在努力,很多公司拿着一堆裸数据,也不知道怎么办,所以我们必须先把数据整理过才能用,他说这还是一个很长的过程。

1 条回复

2017-04-09 20:41
添加回复
回到顶部