1.2 人工智能三要素
此次人工智能的崛起得益于大数据、算力和算法“三驾马车”并驾齐驱,这三者也被称为人工智能(AI)三要素,如图1-4所示。其关系可以简单概括为:数据是源泉,算法是核心,算力是驱动。
图1-4 人工智能三要素
资料来源:《AI生态:人工智能+生态发展战略》。
1.2.1 数据——AI之源
尽管三要素并驾齐驱,但若要以重要性排序,则数据为先,在三者之中占据最关键的地位。自以深度学习为代表的一系列人工智能产品被研发出来后,整个人工智能产业就离不开数据的支持。这不仅是因为概率统计模型需要扎根于数据,同样也是因为对人工智能产品的优劣判断,在很大程度上也要基于其情境数据进行测试验收。
深度神经网络的算法核心设计始于20世纪60年代末,但是当时的计算机及可信赖数据都无法满足对这个算法模型进行进一步研究拓展的要求,更遑论落地产业化应用。甚至在很长一段时间内,尝试通过神经网络构建人工智能被视为异想天开。而随着时代的变迁,各行各业的数字化进展逐年加深,数据总量不断上升,这一想法又被重新提上日程。
另外,深度神经网络模型也可以看作一种统计概率模型,这类模型的一大特征就是数据越多、越优质,算法的表现越好。从这一角度来看,只要深度神经网络模型这个核心特征不变,数据,准确来说是优质的大数据,就永远是人工智能三要素的核心。
1.2.2 算法——AI之核
算法在人工智能三要素中最为人津津乐道,因为它既“高大上”,又“矮穷挫”。说它“高大上”,是因为人工智能算法在很多人类都难以解决的问题上屡屡打破纪录,如物体识别、交通违章实时判定、高精度文字翻译、多语言语音输入、新冠肺炎疫情期间的无接触体温检测等。说它“矮穷挫”,则是因为很多算法都以开源形式共享在网络上,很容易入门学习并尝试。
近年来,人工智能算法的发展受到了来自数据的一定影响。随着大数据总量的不断攀升,并行算法等适合同时进行多线程计算的算法广受欢迎。但是,大量数据并不意味着大量有效数据。随着应用开发场景的逐渐细化,大数据在很多场景条件的制约之下变成小数据,例如,想根据1000张厨具照片生成一个厨具识别应用,将开发目的具体化,于是目标变成西餐厨具的识别,此时适合的照片就只剩下300张了,假设训练高信赖度模型所需的最少样本数是500张,那该项目就一下从大数据变成小数据。类似的情况也催生了很多自生成数据的算法,以期能在数据不足的情况下,有效地扩充训练数据量。也有研究者另辟蹊径,试图使用类似的成品模型进行迁移学习(Transfer Learning),从而通过少量数据实现深度学习[2]。
人工智能的发展催生了很多产业,一些公司会雇用“专业”员工给原始数据贴标签,通过人为加速特定场景的数据增长满足研发需求,这一产业被称为“人工智能数据标注业”。为什么要为专业一词标注引号呢?因为此专业非彼专业。这些员工虽然也从事与人工智能相关的工作,然而只是专业为数据贴标签,做着简单、重复的工作。但这些员工贴标签的正确率却会直接影响日后分析的准确程度,在这个环节中,甚至可能产生人为的伦理问题。
以人工智能为核心的第四次工业革命的发展必然会催生许多新兴领域,这也意味着会产生新兴的数据场景、数据类别。没有不经累积就能实现从无到有的大数据场景,所以面向小数据集的人工智能算法,在未来很长一段时间内将一直是值得研讨的课题方向。
1.2.3 算力——AI之驱
不同于算法与数据之间的相互影响,算力的发展相对独立,其主要取决于芯片产业的技术升级。在芯片设计理论没有出现跨越式发展或突破式创新的情况下,提高硬件精度是推动算力升级的主要因素。台积电在2019年将芯片工艺精度提升到了7nm工艺,iPhone的处理器A12就使用了这一级别的工艺。Apple在其产品发布会中提到,相比于基于10nm工艺的上一代处理器A11,A12在CPU、GPU功率上提升了50%的性能,而A12的处理能力更是A11的3倍。
然而,工艺提升不可能无止境,现阶段半导体尺寸的缩小已经接近极限,当前晶体管的三维结构工艺的节点是7nm,若继续向下突破,所需花费的研发经费会陡增、研发周期会延长。5nm芯片的技术尚在试行阶段,尽管三星和台积电都发布了关于进一步提升技术精度至3nm的研发计划,但技术升级的时间点可能要推迟到2025年前后,其对效率提升所起到的作用,相比于数据和算法“两驾马车”仍旧稍显不足。单纯从提高制造工艺的角度寻求突破越发艰难。
因此,很多芯片厂商也在不遗余力地寻找硅的替代材料,期待新材料的更优物理性质能够帮助芯片生产迈向更加精细化的时代,但这不是短期内可以实现的事情。如今的芯片技术在算力方面的贡献更主要体现为精度提升、芯片小型化所带来的场景定制芯片的便利性。根据各行各业在计算方面的特征和需求,生产对应的定制芯片,如擅长语音识别的芯片、擅长图像处理的芯片、兼顾5G网络架构的芯片等。
数据、算法、算力是此轮人工智能崛起的三要素,在以人工智能为驱动的第四次产业革命浪潮中,这三要素发展的方向会对人才供给产生巨大的需求压力,在新一代人工智能教育培养中,拥有对这三要素定位的清晰认知,同时不断进行有方向性的教育学习,是适应产业改革时代的不二法门。