三、研发自主芯片服务器
2002年,华为第一个服务器部门——服务器营销工程部成立了。华为为了给运营商做整体解决方案,需要给系统设备做配套,所以每年采购IBM、HP小型机金额超过10亿元。一些员工向公司提出,自己做一个产品以替代昂贵的小型机。在这个背景下,华为服务器应运而生。
与其他产品线相比,服务器团队的组建颇为低调,因为他们对接的是内部客户。据服务器产品与解决方案销售总监巩建农回忆,当时公司内部部门提了很多要求,有的要求连IBM、HP的通用服务器都不能满足。不过服务器团队并没有打退堂鼓,邱隆说刚开始大家抱着技术研究的态度去做,后来发现没那么神秘。
(一)6个月研制出超IBM、HP的服务器
“不神秘”的原因在于华为的硬件基因。服务器和交换机、路由器在很多地方是共通的,所以服务器的以太网交换系统、整机的供电和散热,对他们来说都不成问题。唯一困难的是服务器主板的CPU、内存等计算节点,这是服务器团队主攻的方向。大概半年时间,华为第一代电信级刀片服务器T8000呱呱落地。
2015年,法国客户Criteo选择部署了华为的服务器产品,原因是经过对比,客户发现华为服务器的集群性能竟然比竞争对手高出一倍,因此在众多服务器竞争品牌中毅然选择了华为。正因为在产品研发上的持续创新和在满足用户差异化需求方面的不懈努力,才赢得了行业用户的认可。目前华为服务器产品已经基本实现了对全行业的覆盖,被广泛应用于金融、政府、能源等行业,以及以BAT为代表的互联网企业中。华为服务器2015年在国内电力、广电、公安等领域市场份额位居第一位,在银行领域的市场份额位居第二位。
在质量方面,华为在设计、元器件以及流程等方面一直有着非常严格的标准和要求。华为发现导致服务器硬盘故障最大的原因是震动。位于某数据中心机架位上的一个服务器硬盘,故障率高出普通硬盘数倍。经过仔细探究发现,负责机房环境卫生的工作人员经常不经意间用吸尘器碰触此机架位,长此以往硬盘便发生了损坏。为此华为服务器围绕硬盘托架找到许多专家,花费了100万美元,购买了许多设备,进行相关结构的优化,终于制定出适合的解决方案,使位于机架上的服务器硬盘的抗震能力大为增强。
其次,在元器件质量方面确保产品的可靠性。华为服务器一直在抓部件质量,而所有供应商也都是以部件质量为核心来确保对华为服务器的供货。
华为认为,当前包括中国在内,市场的人力成本非常高。如果产品质量问题多,那么维护成本将远远高于产品售价。例如位于欧洲的合作伙伴帮助用户上门维修或更换硬盘需要1000美元,而一台服务器的售价才两三千美元,因此华为必须强调产品的质量问题。在质量方面,华为服务器制定了相应的流程以及测试和认证方式,包括CPU、硬盘、内存都有相应的检测流程及工具。最终华为服务器产品的故障率远远低于竞争对手,因为华为将许多故障排除在了服务器产品发货之前。
另外,华为致力于打造最安全的服务器产品。华为的安全理念从上至下涉及服务器的各个层面,从底层的芯片、代码到上层的软件,都有自己的各种认证测试工具。华为服务器还成立了专业的团队,通过与第三方组织合作进行安全审批工作,华为服务器目前已经通过欧洲专业实验室的安全测试。正是这一系列举措,全方位保障了华为服务器产品的安全性、可靠性以及高品质。
作为服务器市场的后来者,华为服务器成绩骄人:根据Gartner服务器市场报告(2016Q1),华为服务器出货量连续11个季度稳居全球第四,八路关键业务服务器增长率全球第一,刀片服务器中国出货量第一。据Gartner发布的2016服务器魔力四象限,华为服务器凭借业务驱动的持续创新和稳定上升的市场份额,从特定领域者(Niche Players)象限迈入挑战者(Challengers)象限。
(二)2016,崭露头角
2016年,华为服务器产品最大的亮点应该聚焦在2016年3月14日,CeBIT展上正式发布的全球首款32路开放架构小型机——KunLun上,华为服务器全年的市场活动也以此为重点展开。
中国区50+城市的巡展,KunLun分行业(包括中国区金融、公安、医疗、交通、税务、烟草、油气)发布。11月24日,中国邮政储蓄银行、南天信息与华为共同发布银行个人核心业务系统KunLun联合解决方案;与Oracle签订KunLun与Oracle数据库合作协议;12月30日,KunLun 9016通过SAP HANA 12TB GA认证。
2016年,华为服务器不但在市场上做得有声有色,更是得到了国际两大顶级咨询机构的双重认可。
华为服务器迈入Gartner魔力四象限的挑战者象限,充分反映了华为在服务器市场的中坚地位,并体现了华为服务器强有力的上升态势和业界认可度。华为服务器一直以高品质、高可靠性、技术领先、差异化的创新作为自己的价值定位,得益于华为每年将超过10%的收入用于研发的持续投入。华为服务器以客户为中心,围绕客户使用场景,在底层芯片、整体架构、工程设计和上层应用全面持续创新,充分满足客户当前和未来的计算基础设施需求,实现与客户共同成长。
华为荣获Forrester超融合基础设施“强劲表现者”称号,该称号的获得充分体现了华为超融合产品在市场上的强劲表现和竞争力,逐步得到客户和分析师的认可,同时也是华为超融合产品走向市场领先地位取得的一个进展。随着华为在超融合上的持续投入,华为将不断提升竞争力,并为客户提供独特的价值。
(三)2017,“无边界计算”闪亮登场
2017年7月6日,华为在北京发布“无边界计算”服务器战略及系列解决方案,这有点像是华为服务器的一次例行新产品发布会,但实际上这次的重点真不在产品端。
这是华为服务器关于未来的一次宣讲,内容远不是“服务器”三个字能覆盖的,“计算”是一个更精准的代名词。其实从云时代开启,计算这个词就在被有意无意地用来替代服务器,但从没有像华为这般彻底。而且这次,华为还给计算加了一个定语“无边界”,二者结合形成了华为服务器未来5年的战略。
无边界浅显而富有深意,字面意思打破原来服务器盒子的边界,这是业界早已经在做的,虚拟化和云,首要解决的就是这个问题。除此之外,华为还赋予了它新的含义,有三层。一是释放计算潜力,打破计算只依赖CPU的边界,提升计算效率,还有更多选择,还有很多可以做的。二是打破服务器边界,实现DC级别的资源池化和按需供给,提升DC整体计算效率。三是打破数据中心的边界,计算不只是在数据中心内进行。
三者由小及大,由处理器到服务器,再到数据中心,构成了华为无边界计算战略的内涵。该如何理解?第二点很简单,不多解释。这里主要讲讲第一点和第三点。
华为无边界计算战略内涵
前者释放计算潜力。从处理器角度看,CPU性能提升放缓。过去每年提升1.5倍,现在只提升1.1倍。再加上处理器周边I/O的进步几乎停滞不前,严重影响CPU的效率发挥。从应用角度看,CPU的工作模式已经不能匹配很多新应用的需求,比如AI。异构成为一种必然,CPU+GPU、CPU+FPGA的应用模式越来越多。当然,单纯的加法并不能发挥最佳的计算效率,这其中的工作就是华为要做的。具体是什么,后面再讲。
后者打破数据中心边界。业界一直在探讨计算是无处不在的,但服务器这个计算的代名词似乎总被禁锢在数据中心内,形态必须是那样的黑盒子,否则就不叫服务器了。广阔天地服务器大有可为,华为预测到2025年,全球有超过1000亿各类终端联入互联网,其中50%的数据都会在边缘而不是数据中心内进行处理,这些都是未来服务器的机会,甚至市场规模并不比传统的服务器市场小。这是华为服务器的又一个方向。
2017年12月6日,美国权威调研公司Gartner公布当年第三季度全球服务器市场报告,中国浪潮服务器出货量和销售额双双跃居全球第三,仅次于美国戴尔、EMC、惠普。
昔日美国垄断的高端服务器市场,如今涌现出越来越多的中国制造。这份报告中,排名前六位的服务器制造商中还有中国的联想和华为。
此前Gartner公布的2017年第二季度全球服务器市场报告中,指出华为增速最快。
多年以来,华为在技术研发方面一直持续高投入,每年投入额为整体经营收入的10%。这种高投入也保证了华为服务器在各个层面的研发创新,成为支撑其产品快速成长的重要动力。在服务器产品研发上,无论是底层芯片还是上层的软件以及整体方案,华为都有着一系列的创新。
此外,华为服务器还在工程、架构以及应用方案等领域进行创新,比如华为服务器研发的“黑匣子”功能。此前服务器一旦出现宕机等故障,由于没有记录,一般都无法及时追踪到问题原因。“黑匣子”对用户操作、系统兼容性以及软件运行参数进行记录,再加上华为长期积累的服务器故障信息数据库以及大数据分析工具,可以非常容易地帮用户发现导致宕机等故障的原因,在很短时间便能解决问题。同时,借助该功能还可以根据硬盘、内存、CPU、网卡等的表现,对硬件设备未来运行情况进行预测,从而防范相关风险的发生。这样的功能对于用户系统稳定性非常有益。以前只有在高端的大型机上才会有,而现在华为服务器已经具备这样的能力了。
(四)2018,全球一跃而出的黑马
2018年,华为成为服务器市场一跃而出的一匹黑马。
一般人认为华为在5G领域居于全球领先地位,才招致美国的打压与禁用。但实际上华为的产品不止5G通信领域,还包括手机领域,已经成长为全球前三的通信大品牌,给予苹果、三星以极大的压力。
而真正对美国威胁最大的还是华为的海思。其不但发布了基于ARM架构的手机CPU麒麟980、990,与美国的高通形成全面比拼,个别性能甚至犹有胜出。同时还在2019年1月推出了服务器芯片鲲鹏920,显示出华为不惧美国禁用芯片这招。而且华为替代android操作系统的自研平台鸿蒙也呼之欲出,就像阿里巴巴的YUN OS系统,已经成长为全球第三的通用操作系统。
华为的服务器业务自2002年组建以来,历经16年的发展,现在已经成长为全球前五的服务器品牌。仅排在Dell、惠普、浪潮之后。从下图来看,全球服务器五大品牌,我国已经有三个,分别是浪潮、华为与联想。
2018-2019年全球前四大伺服器品牌市占率排名
华为服务器2018年出货量达到91.8万台,较2012年的7.7万台增长了12倍,2012-2018年累计出货超过356万台。
华为服务器领域的业务,随着华为本身技术的进步及在人工智能领域的研发,自主芯片的研发成功,还有华为领导人的高瞻远瞩及华为特有的狼性文化,未来发展一定会锦上添花,更上一层楼。
(五)全球首个智能路由器
2003年华为家庭网络终端部成立。
2004年,华为发布10G路由器,比思科落后4年。之后华为加快创新步伐,不断缩短与思科的技术差距,40G路由器时间差距缩短到2年。直到2010年,华为发布100G路由器,与思科追平。到2012年,华为开启400G路由器时代,从此处于领跑位置。
2005年华为宽带猫实现全国市场份额No.1。2005年起,华为不断开拓国际市场,在欧洲、中东、中亚、拉美等国分别实现数百万的销量,并在2010年实现累计发货全球第一的成绩。
2012年,华为开始进入消费类民用路由市场。华为是第一个智能路由器厂商。
2012—2013年,对于不招人待见的无线路由器市场来说不同寻常,因为智能路由器横空出世。不同以往的、全新的、几乎颠覆式的应用体验和花样翻新,层出不穷的产品设计,让以往因为配置繁杂、功能埋没、只能屈尊躲在阴暗角落里的无线路由器重见天日。
2012年,VDSL超高速多功能路由器面世。它搭载了博通顶级芯片,54 Mb/s电话线与1000 Mb/s以太网线双接入上行,不仅支持DECT-Catiq无绳IP语音电话,首批还支持802.11AC千兆WiFi,更使其成为德国电信专属。
“从目前来看,在网络设备领域,华为等国产品牌产品已完全可以和思科相媲美。”中国工程院院士、中科院计算所研究员倪光南如是说。
2012年9月,华为成功实现了全球最大容量集群路由器搬迁工程——中国联通169骨干网江苏无锡节点核心集群路由器搬迁。这也是中国通信业界首个思科集群路由器的搬迁:13张城域网、110多条干线链路、280G的流量、50多万条路由、海量的数据、复杂的网络链路和路由关系,从思科的设备安全切换到华为的设备上。
2014年,荣耀立方面世。这款搭载了Android和Linux双系统的路由器,通过实现网络互联、存储共享、媒体播放等众多使用功能打造的智能家庭中心,被业界竞相效仿。
2015年,荣耀路由器登场,继承了荣耀立方网络部分的强悍CPU和WiFi性能的同时,利用独家的Hi-Link专利,创新性地提出了双路由分布式WiFi方案,一键解决大户型无线信号覆盖问题。
2016年,发布了业界首个1T平台2+8集群核心路由器,打造出最具演进能力的骨干网平台,最高(集群)容量可达128T。
2017年,推出业界首个基于50GE FlexE的5G承载分片路由器,可提供50GE基站接入能力、无缝兼容100GE。基于创新的FlexE技术,实现端口通道化物理隔离,为不同业务提供差异化的SLA保障。
同年,推出业界首个单端口400GE,并率先商用部署。
2019年,携手中国电信在四川部署了全球首个SRv6商用局点。
Dell'Oro发布的报告显示,2017年第一季度,服务提供商(SP)路由器和电信级以太网交换机(CES)市场发生了巨大变化。来自中国的巨头华为首次超越了白富帅的思科,一举成为全球核心路由器的老大。
在过去的约20年,思科一直是核心路由器市场的霸主,地位之高,如同是魔教教主的“西方不败”。思科占据了全球核心路由器市场份额的80%,这意味着无论是路由器、交换机还是其他网络设备,思科几乎可以用垄断二字来形容,整个通信领域没有一个对手能对其造成有效的威胁。但如今,这一项技术壁垒被华为攻下,实现了破天荒的逆袭,中国制造再一次扬名立万,华为在国际上的影响力与日俱增。
如今华为的运营商级路由产品已经部署在全球130多个国家和地区,服务于全球超过17亿用户。行业影响力方面,其在IEEE、CCSA、ATIS、BBF、ETSI和OMA等标准组织中均为董事会成员、并出任了9个IETF工作组的主席,2018年的IETF IP领域活跃草案数位居世界第一。
C114通信网作家蒋均牧撰写专稿指出:“超越背后:压强式投入下从‘芯’开始的全面领先反超的故事大家都爱看,正是因为其稀有性。华为在运营级路由器市场上何以达成这一壮举?究其原因,在于压强式投入下的持续创新以及对客户诉求的把控。”
蒋均牧说,以芯片为例,这无疑是路由产品的核心。而华为很早就意识到自研的重要性,自1999年开始研制基于ASIC架构的Solar芯片,2004年正式商用。在3.0时代,Solar芯片即已领先业界,目前为止已经演进到基于NP架构的5.0版本。
Solar 5.0发布于2016年,采用了16 nm制程、集成45亿门电路,是世界上首个T级网络处理引擎(单芯片1.2T)。它拥有2.2倍于业界的288个内核、1.5倍于业界的3168个线程;架构上的持续优化使之较上代版本提升了4倍的吞吐量。可靠性上,华为独创了Atom-NPU-Thread三级隔离技术,并引入Memory全校验以消除单比特软失效。
能耗上,Solar 5.0通过对动态调频(每次降频可节省10%)和智能开关核技术(关闭单核可节省0.2W)的支持,相较上代版本降低了37%。新技术融合方面,支持10层以上SRv6高性能转发、us级Telemetry数据采集、FlexE/FlexE+等。
2018年,华为拿下运营商级路由器市场第一,实现对思科的超越
“哪有什么洪荒之力”,尤其在技术密集型领域,成功很大程度上有赖于研发创新投入的决心。根据华为发布的年报,2018年其研发费用达到1015亿元,占比销售收入14.1%,位列欧盟发布的2018年行业研发投资排名第五位。在过去十年中,在研发上累计投入超过4800亿元。联合国下属的世界知识产权组织(WIPO)发布的数据显示,2018年,华为向该机构提交专利申请高达5405份,位居全球第一。
蒋均牧的调研数据扎实、详尽,因此富有权威性。
在数据通信领域,华为公司整合了全球研发资源,以打造业界一流的产品。其中包括法国巴黎的算法学习研究中心、美国硅谷的芯片预研中心、日本横滨的超导材料研究中心、德国慕尼黑的网络规划实验室、印度班加罗尔的VRP平台研发中心,以及国内北京、南京、深圳的产品开发中心等。
从客户诉求角度,除了性能、功耗、集成度这传统“三围”,可靠性更是运营商衡量路由产品的一项重要指标,华为深知这点。为了让运营商“买得放心、用得省心”,甚至对路由器产品做出了“0事故”的承诺。为此,它不仅建成了拥有3700多台设备、超过10万条测试用例、能够1∶1模拟现网运行情况的业界最大的自动化测试工厂,以及开发了能够100%覆盖单板焊点、无需手工干预的业界首款智能硬件测试系统,还制定了覆盖从设计到开发、从生产到安装运行的全生命周期的严苛质检标准。
此外,网络的稳定性要求也决定了存量设备难以被替换,曾经一度成为横亘在市场后来者面前的一道鸿沟。华为在这方面也积累了丰富的工程施工经验,并开发了相应工具。2012年9月,它协助中国联通在无锡完成了业务不受损的核心集群路由器平滑搬迁,这也是当时最大规模、最具挑战性的IP干线网络整网搬迁工程,从此完全打消了运营商的顾虑。
“博观而约取,厚积而薄发”,从10G、40G时代追赶,到100G时代并肩,再到400G、1T时代的超越和领先,华为运营商级路由器的这一励志轨迹,正是中国ICT力量全球崛起的一个缩影。此次市场份额的跃居榜首,也标志着一个时代的交替。
蒋均牧最后写道:
面对即将到来的5G时代、智能时代,华为方面表示将持续践行极简架构、极简协议、极简站点、极简运维的理念,在网络架构、智能运维、网络协议、转发芯片、高速端口等领域不断创新,引领智能IP网络,致力将数字世界带入每个人、每个家庭、每个组织,构建万物互联的智能世界。