颜水成:深度学习领域原创成果,都不诞生在中国
讲者:颜水成 (奇虎360公司集团副总裁、人工智能研究院院长)
整理:邸利会
速读:
深度学习领域最原创的成果,其实都不诞生在中国
在理论机器学习领域,中国做的好的研究者不过5到10人
专注在比较原创的技术,而且把技术用在产品中,不只是会成就一个好公司,可能是一个伟大的公司
连接之后意味着黑客就有机会渗透到你的智能硬件里面了,他想做什么样的事就他说了算
深度学习或是人工智能没有完美的算法,在自动驾驶中,到底撞前面的人,还是把车右转出车道让自己产生伤亡,道德层面真的不知道该怎么做
我原来在学术界当教授七年,后来在360公司任职近三年。我以前做的是计算机视觉。不得不说,在过去这些年人工智能发展的速度非常快,特别是在学术界,大家可以看到,每一年和人工智能相关的学术会议发表的文章越来越多。去年我们做过一个粗略统计,和人工智能相关的会议每年发表的数量有4000多篇。这带来一个很大的问题,到底到哪儿去寻找足够多的审稿人,能对文章进行正确的审核。今天我不想说人工智能多么红火,大家都看到了。我想分享两个人工智能比较长远的话题,原创性和安全性。
1. 原创维度
在学术界和工业界,AI技术无外乎三种,一种是非常原创的,我们叫颠覆式技术创新;另一种是微创新。第三是没有创新,技术在一个领域取得了成功,然后照搬到另外一个领域来。学术界做人工智能的研究成果跟数据、应用场景是相对独立的,意味着在学术界做研究原创性变得非常重要,如果没有原创性就很容易被大家遗忘。
AI是一个非常大的话题,我们现在看现在最火的深度学习。如果仔细去观察,在深度学习领域最原创的成果,比如卷积神经网络、生成式对抗网络、深度学习与增强学习的融合等,可以看到最初的点其实都不诞生在中国。中国在这个领域更多的是,这些理论出来之后大家觉得非常有意思,一窝蜂出来。比如像生成式对抗网络,大家发现很有意思之后,计算机视觉领域的会议比如CVPR,就能看到一碓的文章全部干这样的事,但真正能被大家所记住的还是第一个提出者Goodfellow。
最近深度学习的发展,大家对理论的期望越来越高,也就是说我们不再只是去调调参数或者设计一个网络稍微做一点调整,这意味着对于理论机器学习研究者的需求会越来越大。最近我和一个好朋友,一个做的非常好的教授,做一个讨论。我说我们俩要不要把中国做理论机器学习做得比较好的研究者全部列出来。我们俩微信交流后,最后有一个名单。我是比较保守一点的,列出来大概有10个,但没想到那个教授更加保守,他的名单其实只有5个。也就是说,在中国做理论的机器学习领域,人才的储备是非常少的,或者是没有多少人愿意去做这些基本的研究。
但是,这倒也不要那么悲观,现在国家特别是新一代人工智能的战略出来之后,对大家来说是一个很好的契机,尤其做的比较好的研究者可以留在学校慢慢在这方面做一些比较原创性的贡献,因为原创性是非常重要的。
工业界和学界不一样的地方在于,它没有训练数据和测试数据的概念。工业界就是要解决一个问题,有一碓数据,然后训练,产生一个模型,应用到产品里,如果不起作用就去想办法,比如去收集额外数据中失败的例子,然后去增强测试的数据,不断迭代,让应用的场景在推广的范围之内。
一个业务的成功取决的因素不只是技术,还有产品,最终用户,也包括团队。那么,这意味着什么?这意味着即使你不做非常原创性的研究工作,只是把好的研究用在工业界的话,也可以成为一个比较优秀的公司。但如果这个公司能有足够的投入,比如可以专注在这些比较原创的技术,而且把技术用在产品中的话,意味着最终不只是会成就一个好公司,可能是一个伟大的公司。
从优秀到卓越,如果你更加在乎原创性的话,可能会成为一个卓越的公司。目前,中国卓越的公司还是比较少,但我们已经具备这个条件了,我们有好几个公司在世界范围内都已经是巨头的公司,他们有足够的财力去组建相应做原创的技术研发的部门,瞄准的不是一年的产出,而是三、五年甚至更长时间的投入。所以,我觉得机会还是非常有的。
2. 安全维度
另外一个维度,我想分享的是安全。安全可能大家现在思考的还不是非常多,但其实非常关键。
第一点,软硬结合之后智能硬件的安全性问题。现在我们会用很多传感器,比如有摄像头、雷达、激光雷达,但这些传感器其实是非常脆弱的,是很容易被攻破的。比如一个摄像头拿激光笔对着它,那它很快就会致盲,那如果用摄像头做自动驾驶的话,挑战是非常大的。
还有一个问题大家容易忽略的是,传感器会有老化的问题。老化以后,它获取到信息的精准度没有以前那么高了,现在人工智能的算法都是不停的调优调出来的,如果过了一年两年之后,到底老化会产生什么样的影响,以前的模型到底还能不能工作,整个基本上是没有做任何的探索的。
第二点是AI软件的安全性。现在大家用深度学习的框架,比如Caffe、Tensorflow,但这些框架多是建立在底层的软件开发工具包上的,这些软件开发工具包本身也是软件,里面也存在缺陷。比如我们做一个图象识别的算法部署到服务器上,黑客可以利用软件的漏洞在图片上加一些信息进去,这个图片就可以让服务系统或者陷入死循环,或者被劫持没有办法获得系统的控制权限,这些也是我们平常想的非常少的。
最后一点,软硬结合的智能硬件,意味着连接变得不可或缺。连接之后,这也意味着黑客就有机会渗透到智能硬件里面去,他想做什么样的事,就由他说了算。
另外可能还涉及到道德层面上的问题,比如说我们基本上有一个观点,深度学习或者人工智能是没有完美的算法,就意味着一定要处理一些特殊问题,比如你做自动驾驶,在极端情况下就需要做出一些决定,比如到底是撞前面的人还是把车右转到车道让自己产生伤亡,这个从道理层面真的不知道该怎么做。总的来说,我想说,原创性和安全性非常重要,AI公司如果要活的更长久更优秀,这两个维度可能是大家真的要花时间去关注的点。
注:本文根据颜水成在“世界科技创新论坛”上的演讲整理而成