
1.7 AI=数据+算法+算力
AI是对人的智能的模拟,为了使得AI产品具有人的能力,需要收集大量的、正确的人的语言、行为、情感等数据。数据是基础,然后用这些数据来训练AI算法。用AI算法计算数据的规则时需要大量的计算资源,即算力。
因此,在某种程度上来说,AI=数据+算法+算力,算法、算力、数据也是AI产业爆发的三大条件。
例如,平安金融拥有大量的用户办理金融业务的数据,基于此,平安金融的AI产品经理协同AI算法工程师搭建了AI算法模型,即金融AI风控模型,利用计算机资源不停地进行训练。平安金融的AI+金融产品已经能够将原来用户需要到现场才能办理的业务转到线上,这就是通过“数据(庞大的用户数据)+算法(生物识别算法等AI算法)+算力”实现的AI产品。
进一步来说,AI从概念到产品的爆发需要具备三个条件,即算法、算力、数据。
在算法方面,随着深度学习理论和工程技术体系的成熟,包括通过云服务或者开源的方式向行业输出技术,先进的算法被封装为易于使用的产品和服务,越来越多的人和公司能够使用这些算法。AI相关的技术包括了水平层和垂直层的技术,水平层的技术主要体现在算法方面。这两个层面都有很多大厂商在做,谷歌、亚马逊、微软等都试图搭建通用的机器学习和深度学习底层计算平台。而上层的应用,比如语音识别、文字识别、图像识别、即时定位等,也有很多开源的框架,特别是在图像处理领域,很多框架都应用了机器学习和深度学习技术。从这方面来看,笔者认为AI的产业化已经开始了,各个层面的企业都已参与其中。
微软在2016年9月份进行了重组,成立了微软人工智能及微软研究事业部。2018年4月,微软人工智能及微软研究事业部的重要性明显增加,与体验和设备部门、云计算与人工智能部门成为微软旗下三大工程部门,拥有5000多位科学家和工程师,这是一项巨大的投入。再比如,IBM在2018年年初提出转型到认知计算(Cognitive Computing)和云平台,高调进入AI领域。除此之外,国内的百度、科大讯飞等公司也在AI上投入了大量的资源。
所以,从趋势上来讲,AI时代已经到来是明确的。
在算力方面,云计算的兴起发挥了非常关键的作用。深度学习是极其消耗计算资源的,而云计算可以以低成本获取大规模的算力,动态地获取几千个CPU,甚至上万个CPU的算力都不是难事。除了云计算,GPU计算能力的进步对深度学习也有很大的推动作用,它能够加速深度学习中的计算速度,在某些情况下甚至能实现成百上千倍的提高。例如,现在深度学习的算法涉及大量可以并行化的矩阵运算,而GPU的工作方式就是多核并行计算,这个特点特别适合AI领域中的计算。此外,一些面向AI的专用硬件架构也开始出现,比如用FPGA去做专用的AI加速芯片和基础的加速设施,微软的数据中心就大量运用了FPGA。
在算力相关的技术领域中,英伟达是较早意识到AI潜力的公司。早在2012年,英伟达就开始在AI上投入大量资源,陆续发布了针对服务器端的DGX-1以大幅加快训练速度、基于Pascal架构的Tesla P100以支持数据中心加速、针对嵌入式产品的Jetson TX1,获得了市场的高度关注。从总体来看,英伟达的产品线体系已经比较完备,并且英伟达并不只是提供一个空的计算架构,还给软件开发人员提供了很多开发的库,如为实现汽车的自动驾驶提供从模组到软件的一整套解决方案。英伟达的AI战略是很清晰的,有很多实质性的产品落地。比如,已经有多家公司将英伟达技术嵌入摄像头中进行视频数据智能分析。
此外,英特尔也不容忽视,虽然它意识到AI爆发稍微滞后一点,但是它的补救动作是很及时的。在2016年,英特尔收购了包括Itseez、Nervana System、Movidius在内的众多AI技术公司,加上Altera和Saffron Technology等,英特尔在计算机视觉技术、数据中心AI计算加速、FPGA芯片等方面快速完成了布局。尽管它的发力晚了一点,但展示出了坚定的决心和强大的实力。笔者认为,推出面向AI的CPU、GPU、FPGA的融合计算架构,一定是它未来的发展方向。
从总体来看,两家各有优势,如果从收入规模来看,英伟达比英特尔小得多,正是因为它的体量小,所以在AI领域的收入比例显得大很多,这是它引起媒体持续关注的一大原因。
除这两家之外,高通也是一个很有潜力的参与者。高通的强项是移动芯片,而移动芯片的低功耗要求使得运算性能很难做得特别高。因此,数据训练显然不是高通的强项,因为数据训练是性能驱动的。但是高通专注设备端所需的推理计算,在移动端功耗很低、算力不是那么强的场景,高通能够满足场景对AI能力的需求。高通一直试图打入一些终端市场,例如车用芯片市场,以实现业务多元化,获得这样的能力有两种途径:一种是加强通用计算的能力,比如CPU计算单元应该做一些什么样的改进才能适合AI的工作;另一种是针对特定领域的问题,比如针对视觉、语音等领域的问题,开发专用硬件并提供给设备端。现在很多公司的发展方向都是把专用领域里的一些能力放到端上去。
一些AI应用领域(如AR、VR、MR)对智能能力有很强的需求,如对外界环境的智能感知能力、基本的几何识别能力、语意理解能力的需求。而AR、VR、MR所需要的AI很多是要在端上实现的,不能完全依赖于云。所以我们可以看到,未来会有很多类似高通的厂商进入设备端智能能力的提供领域。AI在设备端的需求量是相当大的,预计到2021年,我们就能够看到大量设备端AI产品出来。
当然,虽然我们谈了很多硬件基础设施对AI发展的支撑,但是影响AI算力需求最重要的还是软件和算法,因为算法决定了计算的复杂度,也就决定了对算力资源的需求。在另一方面,无论是CPU、GPU还是FPGA的计算架构,规模庞大的算力将主要通过云服务的方式向广泛的公众用户提供。谷歌、脸书、亚马逊、微软等行业龙头,都在大力开发云服务,积累了大量的算力资源,期望能够成为智能时代的计算平台“霸主”。
在数据方面,近年来移动互联网的爆发使得我们积累了大量的数据,同时物联网也极大地扩展了AI获取数据的数量和类型。事实上,相较于算法和算力,数据的获取会更难一点,因为它是建立在已有业务基础上的。以往我们都是先通过非AI的方式积累大量的数据,而现在初创企业要去获得数据需要一些“巧劲”。每个时代都要解决不同的问题,今天AI公司也一样需要去解决问题,企业要竭力避免打着AI的旗号,做一些不接地气的事,要为用户解决实质性问题。
谈到数据,笔者认为这是国外厂商要实现AI技术在中国落地需要解决的一个重要问题。在数据管控方面,我们国家对数据主权的保护越来越重视,这对国内的企业来讲是一个利好。但是,长期来讲,数据的流动是难以避免的。对此,国内企业要及时抓住时间窗口,快速建立起竞争壁垒。
笔者认为,在2018年,以上三方面都已经做好启动准备,AI时代已经真正地到来了。
AI的发展路径一定是以创造价值为导向,而不是以技术先进为导向的。对不同的产品来说,在某些情况下AI是优化产品的支撑手段,而在另外一些情况下则是创造差异化竞争优势的初始核心能力。在创业时一定要明白自己产品的属性到底是什么,以及AI在产品不同发展阶段的不同作用。