对 AI 的观察:商业回报是大家最关心的问题-资讯-知识分子

对 AI 的观察:商业回报是大家最关心的问题

2019/05/23
导读
回归商业的本质

从学术界、成熟企业以及初创企业的观察来看,大家不再只是考虑 AI 长远的落地,更加关注 AI 的投资回报,也就是说,AI 正在回归它的商业本质了,这个是迟早的事情。


撰文 | 颜水成(360 人工智能研究院院长)

编辑 | 邸利会


作为一位AI的观察者和实践者,我想谈谈在学术界、工业界和创业的团队里,发生了一些什么事情,以及我个人对这些事情的一些看法。


在过去的将近一年多的时间里面,我觉得有两件事情对 AI 的影响是非常大的。


第一件事情是,在去年年初的时候,区块链和比特币爆发的时间点,很多风投好像突然一下子对人工智能丧失了兴趣,把精力和投资的欲望完全转向了区块链。当然,这件事情也不完全是坏事,有一个好处是:大家对区块链和比特币有了更清楚的认识。


第二件事是,今年,深度学习的三架马车:Yoshua Bengio、Geoffrey Hinton 和 Yann LeCun,拿到图灵奖之后,又为 AI 注入了一个强心针,大家有更强烈的热情去推动 AI往前发展,AI渐渐地开始回暖。


图1. 深度学习的三架马车获得了图灵奖。


对学术界AI的观察

在学术界,我第一个观察到的是,AI 的论文数目已经完全超越了所有学者能够阅读的极限。


今年恰好我是 ICCV、CVPR、AAAI 和 IJCAL 四个会议的 领域主席。其中,AAAI 收到投稿量7095 篇,接收了1150 篇;CVPR 是在 2 月底开的领域主席会议,收到了5100 多篇论文,接收了 1300 篇,ICCV 和 IJCAL 还在审稿当中,分别至少有四千多篇的投稿。


过去我们参加一个会议,基本上利用四天左右的时间扫一遍会上感兴趣的文章,是完全没有问题的。但是现在每天发表的论文的速度,让学者完全没有时间去进行通读,这对于学者来说是一个非常大的挑战。很多人也希望利用 AI 来进行辅助,筛选自己感兴趣的 AI 论文,以利于我们能够更好学习 AI。


有一个人利用业余时间写了一个叫 Arxiv  Sanity  Preserver,希望用人工智能的方法,把读者感兴趣的论文给筛选出来,同时可以相应的去推荐一些用户可能会感兴趣的论文,非常像信息流的推荐系统。我觉得如果 AI 能够帮助我们更好的读 AI 论文,也是一个非常有趣的事情。


第二个观察是,门派已经逐渐消失了。


以计算机视觉为例,我在读书的时候,有 Adaboost 派、有 Deformable Model 派、有特征设计派,也有理论功底比较深的 And-Or Graph 派,但现在已经完全改变了,全民都想只用一招,就是深度学习。


第三个观察到的现象是,现在论文的影响力出现了资源分配不均的现象。


Google、Facebook、微软这样的大公司,包括国内 BAT 这样的公司,要写一篇好的论文,可以调用的 GPU 的数量可能是成百的,甚至更多;但是在高校里面,一般一个学生只能分到一块到两块 GPU,情况好点的话,也许有八块 GPU 可以去做一篇论文。


可以看到,最近发表的这些原创的有影响力的论文,它使用的 GPU 的资源是非常令人惊讶的,比如谷歌这篇 NASNet 的论文,它花了 83 个 GPU-Days;另外一篇 Facebook 的论文,用了 7382 个 GPU-Days,这在学校里面是基本上不可能做到的事情;前不久发布的 BERT,用了 256 个 TPU-Days。


大家可以看到,这些工作确确实实都开创了一个新的时代,或者说一个新的方向,都非常有价值,但这些工作从某种意义上来说,已经是学术界没有办法去做的了。


这个情况对于学校的研究者,以及 AI 研究公平性方面要引起反思,当然我们不能说它好或不好,但是事情都已经发生了,我们大家还是需要注意的。


第四个观察是,在近一年时间里出现的重要的进展,它们的落地性还不是特别的好,所以我们还可以让子弹再飞一会。


比如,今年的 BigGAN 和 StarGAN,它的效果确实非常好,但是我们也没有想清楚这个东西到底可用来干什么,到底有什么样的商业场景。


这可能是在接下来的一年或者更长的时间里面大家所需要思考的,比如今天的 BERT 效果非常的好,但是它的功耗实在太大了,还暂时没有办法直接在产品中使用,怎么样去降低功耗,让 BERT 模型仍然能够达到比较好的效果,是需要进一步往前推进的事情。


另外一个就是强化学习。Big  GAN 花了很多的人力在做这个方向的研究,但其实,GAN 在其他场景的价值,还没有得到充分的彰显。


我们也曾经尝试,让它去解决比如像广告推荐、金融风控等方面的问题,但是后来跟其他的公司进行探讨的时候,我们发现强化学习在其中发挥的价值还是非常的小。


这些东西都非常有价值,但是在实际的商业场景中,可能还需要让子弹再飞一会,或许还需要更长的时间,才能让它发挥出价值来。


第五个观察是,在端上的高效的模型已经成为热点,而且是刚需。也就是说,现在深度学习已经从“可以用”时代逐步进入到“用的起”时代了。所以在过去这一年里,大家可以看到有非常多的相关工作和研究在进行,比如:怎么把硬件的特性考虑进去,可以让模型在端上能够有实时性?


学术研究与工业研发的区别

从学术界的角度来看,我们基本的目标是希望能有一些优质的论文发表,能在比赛上获得更好的成绩。我认为学术界的研究更像是一种个人的冲锋战,但是到了工业界之后,特别是成熟的公司,他们的目标不只是做算法研究,或者说纯粹的发表论文,而是需要把技术放在一个闭环里面。


图2. 工业界的研发需要考虑更多因素,需要团队协作


现在工业研发中,有两个维度非常重要,一个是价值闭环,一个是数据闭环。


“价值闭环”是什么呢?在《创新者的窘境》这本书里面,讲了四个纬度:技术、产品、客户和体验。


为什么有一些好的技术,在传统的大企业里面,反而落地非常困难?


一个主要的原因是:技术虽然能够带来价值的增加,但是对于消费者、销售商、客户或者企业,如果有一方的利益没有增加,那他就没有动力去利用这项新技术。所以一定要把技术放在一个闭环里,让闭环里每个维度的人都感受到价值的增加,这样的话,才有可能让一项技术在传统的企业里被大量的采用。但这是非常困难的。


而据我们的观察,最近很多的互联网的产品,除了这四个纬度之外,还有一个维度也变得非常重要,就是社会价值观。当有一个产品的社会价值观没有起到正向的推动作用,往往这个产品也很可能会走向失败。


在闭环中,企业、技术、产品、客户、价值观,他们之间是相互依存的。我们通过技术创新来孵化新的产品,接着在真实产品中,去收集有效的数据,用这些数据来迭代和优化我们的技术,最终技术又进一步的提升产品的体验。


用户的反馈会对产品产生什么样的有意义价值呢?


比如一个扫地机器人,它纯粹依靠传感器来转向有时候不是那么精确,有时候需要依靠碰撞的方式来确定是不是到边界了。我们一开始并没有在机器人外面做缓冲装置,而是有个用户,他自己在扫地机器人上面加装了这个东西,这样当机器人碰到一些比较脆弱的、或者珍贵的家具的时候,就起到了一个很好的保护作用。


如此多的用户,他们会根据真实碰到的问题,不时产生一些非常创新的想法,这个想法返回到企业里,有可能会给产品带来进一步的改良和优化。


第二,数据闭环。这其实是非常重要的,特别是对算法来说,我们一定要建立起数据闭环。


我们一般会专注在算法模型的部分。算法模型和产品本身产生的数据,以及用户在使用过程中产生的各种交互的数据,要形成一个闭环。


比如:算法模型为智能产品提供一个功能,同时智能产品又为用户提供服务,用户在使用过程中,又会有很多反馈信息,它们合在一起,形成一个闭环,这个闭环是我们发现问题、解决问题和不断的去迭代产品的一个过程。


为什么要建立一个闭环呢?我觉得一个核心是:因为 AI 没有完美的算法,比如设计一个人脸识别的算法,并不一定在所有场景都能取得很好的效果。


至于为什么人脸识别的一些公司能存活下来?我认为主要原因是:每家公司都在特定的一些场景下,有自己的数据优势,可能在某个场景下,A 公司能一统天下,别的公司就没有办法能够进来。


另外,特定场景的数据,还可以不断的优化算法。最关键一点:算法模型的优劣并不是产品成败的直接决定因素,产品的设计、用户交互的友好性等等都要不断的考虑进去。这些因素可以在用户的反馈和数据的生成过程当中逐步得到,最后能形成一个非常有竞争力的产品出来。


对于学术界研究和工业界研发的差别,我有一个小的总结:我认为学术界更像是两个人在谈恋爱,工业界更像是结婚后的男女。


如何理解呢?学术界的研究,每天一点点的进步都会让你非常的开心,比如你有一个想法,发表了一篇论文,同时还希望达到新的境界,希望发一堆论文出来,看到的全是好的一面,而且你可以自由的憧憬,为什么?因为暂时没有人催你生孩子(产品),你可以梦想如果我用这些技术打造出一个产品会多么的美好,而且你会认为这个产品一定会是世界上最好的产品,因为反正你不用真的把这个孩子给生出来。这就是学术界的情况。


但是到了工业界,更像是结婚后的男女,你发现生孩子(产品)成了你最首要的任务,因为你的老板天天会催着你生孩子。你以为生出来的孩子很乖巧,特别是刚从学术界出来的时候,会认为我做出来的产品肯定是世界上最好的,但是来到工业界之后,你会发现一堆的问题,一堆的毛病,有很多问题你之前根本没有想过,比如供应链、销售等等,有各种各样的问题,都是你没有想到的。以前你不关心的因素,后来成为了最关键的因素。


用户不喜欢产品,你就要不停的根据经验和用户反馈来调整,最后这个产品越来越好了,你的头发也白了,身体也坏了,但是看着自己的孩子还是一脸的幸福。


这确实是学术界和工业界的差别。


成熟企业和创业公司的区别

我觉得创业公司,其实有些相似性,特别在技术的维度。所以我把关于初创企业的一些观察,和成熟企业的观察就放在一起了。


首先对于初创公司来说,AI 不是一个最终的产品,它必须要跟具体的场景和业务相结合才有价值。我们总是要明白,AI 只是在一个闭环里面的一个子链条或者一个加速器,它并不能算是一个产品。


比如做一个智能硬件,除了算法之外还有产品的工程化、设计、市场销售、服务器,还要考虑 AI 的硬件化,让它能够更加的高效。但是我们往往更没有想到的是供应链和售后到底会发生什么事情。这些是我们刚开始不会想事情。


第二点,我们要承认 AI 技术已经不是孤品了,它已经不存在什么真正意义上的必杀技。


我在观察的时候,突然想起我看过的《马达加斯加》,感觉非常形象:在纽约时代,这匹斑马就是一个孤品,因为没有别的同类,它所会的一切技能就是必杀技;但是当他回到草原的时候发现不是这样了,其他的同类也都会同样的技能。


AI 技术已经不再是孤品,那么大家也不必幻想 AI 存在必杀技。我们现在更多的需要考虑,AI 怎么样能跟商业闭环融合在一起,逐步形成它的壁垒。


图3. 大家不必幻想 AI 是必杀技。


另外,AI 是没有完美的算法的,但是我们又希望有毫无瑕疵的用户体验。想做一款好的产品,纯粹的算法科学家是不够的,你需要有产品工程师来帮助你去用不完美的算法,产生无瑕疵的用户体验。


举个例子,比如说你有人脸方面的各种技术,如果你只是想用它换脸肯定效果不行,但是如果你想用它来,在人脸上加上一些装饰,就能做得非常好,而且效果也会非常的不错。


另外一方面,如果 AI 没有完美的算法,那么人机协同,或者人在闭环,往往也有一些商业模式能够建立起来。一般的做法是:先人在闭环,再逐渐的 AI 化。


举个例子,我原来在新加坡的时候去评测过的一家叫 TRAX 的公司,这是一家以色列的公司,它所做的工作是识别货架上的商品,而且要识别到子类,同样是洗发水,它要知道洗发水的尺寸等等。


它的动机是什么呢?商场里面每年有大量的商品,由于样式太多,人工没有办法去实时监督商品数量,导致每年损失高达五百多亿美金;另外,货架上的商品怎么样摆放,也是有严格要求的,如何摆放才能让客户去购买的可能性最大?


这家公司通过摄像头,去识别货架上商品的量有多少,以及它的位置是什么样的。有一些供应商,为了能够得到这个数据是愿意付费的,因为他们会经常派人,去不同的超市商店里检查自家产品的摆放等等,这个工作人工的成本非常高,如果能把它自动化,一些公司肯定是非常愿意的。


但是目前物体识别的精度只有 96%,怎么办?这家公司就在印度和马来西亚,召集了一批实时调度人员,先用自动算法做分析,再用人工来进行修正,通过人机协同的方式,运行起来了这样的商业模式。随着数据收集越来越多,它的精度可以逐步的提升,人工校对的人数也会随之减少。


所以,人机协同也是解决人工智能算法不完美的一种很好的方法。


AI 的两个巨大推动力

另外,现在还有没有新的元素,能够去推进 AI 技术往前走?我个人觉得,5G 和 AI 芯片应该是 AI 两个巨大的推动力。


首先,5G 的下载速度快,据说能达到一秒钟下载 1.7G 的数据;第二个特点是高接入量,5G 的设备的数量,可能是现在的几十倍,或者更多;另外很重要的一点是低时延。


有了这些特性之后,比如在 VR 领域,如果带宽提升了,那么用户的体验就会变得更好;此外,高接入量对 IOT 有非常大的帮助;至于低时延,对于 AI 和自动驾驶是非常有价值的,因为自动驾驶车辆的设备,以及车和车之间的连接都需要具备低时延的特点。5G 对于这些场景的落地有非常好的推动作用。


而 AI 芯片最大的好处是什么呢?


如果 IOT 设备的计算全部靠云端的话,那么在时延和隐私性方面可能会不那么好,如果端上智能设备的算力足够,比如家里的摄像头,那么就可以把图像通过本地进行处理,不需要上传到云端。


如果把对于学术界、成熟的企业和初创企业的这些观察总结起来的话,大家可以看到,对 AI 不只是去讨论它的三要素,也不只是说 AI 要落地,而是说现在大家已经开始要关心投资与回报,AI 也真的开始回归商业的本质,跟之前的互联网、移动互联网时代一样,商业回报是大家最关心的问题。


以上是我过去大概一年多的时间里面的一些观察。



文章头图及封图片来源:iqlect.com


参与讨论
0 条评论
评论
暂无评论内容
《赛先生》微信公众号创刊于2014年7月,创始人为饶毅、鲁白、谢宇三位学者,成为国内首个由知名科学家创办并担任主编的科学传播新媒体平台,共同致力于让科学文化在中国本土扎根。
订阅Newsletter

我们会定期将电子期刊发送到您的邮箱

GO