又是一年华为全联接大会,这两天各种被刷屏,不仔细看,会觉得和往年差不多,新产品、新技术、新解决方案、新生态计划,年年都有。而认真回味一下发现又不对,今年的风向标完全变了,华为大谈特谈鲲鹏+昇腾、各种开源……计算成为本届全联接大会的主元素。
追求:为世界提供最强算力,让云无处不在,让智能无所不及。
路径:打造“一云两翼、双引擎”的产业布局,构筑开放的产业生态。
其中,双引擎指围绕“鲲鹏”与“昇腾”打造的两个基础芯片族,构筑异构的计算架构。
两翼指智能计算业务以及智能数据与存储业务。在智能计算领域,面向端、边、云,提供“鲲鹏+昇腾+x86+GPU”的多样性算力。在智能数据与存储领域,融合了存储、大数据、数据库、AI,围绕数据的全生命周期,让数据的每比特成本最优、让数据的每比特价值最大。
一云指华为云,通过全栈创新,提供安全可靠的混合云,成为生态伙伴的黑土地,为世界提供普惠算力。
开放的生态指通过硬件开放和软件开源,使能广大合作伙伴,形成一个开放的产业生态。
其中的逻辑,双引擎是核心技术,两翼是应用场景,一云既是实践田也是对外输出算力的窗口,开放生态是连接器。毫无疑问,这是一个完整的商业闭环,关键看推进情况。
接下来,我们就讨论一下华为全新计算战略落地的可行性。
成功的关键之处在哪?无外乎两点,顺应趋势,跟上算力多样化需求这一大势;探索出开放生态这条道路。
是不是先不作答,先看势是什么?当下,计算产业正在呈现四大趋势。
一、从数据中心到计算中心。未来数据中心的主要作用是计算,而且需要的算力直线上升。据统计,目前每年AI算力需求增长超过10倍,预计到2025年,AI算力将会占据数据中心算力的80%以上。数据中心正逐步演变为计算中心。
二、端和边正驱动计算架构的创新。端和边目前更多使用的ARM架构芯片,云则更多是x86架构,基于ARM架构的移动应用迁移上云,性能损失约40%,不仅影响用户体验,而且增加迁移成本。更为关键的是,端和边的芯片使用量远超云,这意味着前者将主导、牵引生态的发展,进而驱动中心侧计算架构的创新。
三、计算应与能源和环境友好。算力提升的同时,能耗能不能不增加或者少增加,这看起来像是悖论,实际则可以做到。以华为此次发布的Atlas 900 AI训练集群为例,算力达到了256 PFLOPS。实现这样的算力,如果采用通用CPU需要6195个机柜,用GPU需要208个机柜,而NPU如昇腾只要128个机柜。但是,其实最后华为只用了16个机柜,因为除芯片优化之外,还增加了系统级优化,如板级液冷、柜级密闭绝热等。算力提升,功耗不增反降。对环境友好,还节省成本。
四、计算架构的持续创新。摩尔定律放缓已经成为事实,但算力这些年其实是在持续提升的,这得益于架构的持续创新,计算架构百花齐放已是既成事实。
显然,大势是社会需要充裕、高性能、多样性、绿色、触手可及的算力。事实上,这也是华为致力为全世界提供的。
风口之下,玩家无数,走不走得到最后,得拿产品、数据说话。简单列几个对比参数:
鲲鹏包括服务器和PC机芯片,鲲鹏920是业界首颗64核的数据中心处理器,性能比业界主流处理器高25%、内存带宽高60%;同时把CPU、桥片、网络和磁盘控制器“4合1”,是业界集成度最高的数据中心处理器。
昇腾包括训练和推理芯片,用于训练的昇腾910,半精度(FP16)算力达256 TFLOPS,是业界的2倍。用于推理的昇腾310,整型(INT8)算力16 TOPS,功耗仅8W。
基于昇腾910处理器开发的Atlas900,在ResNet-50测试中,以59.8秒的成绩位居全球第一,在同等精度下比第2名快15%。
基于鲲鹏处理器的华为云鲲鹏云服务,在原生应用场景,综合性能提升80%;在大数据场景,任务处理耗时降低35%。
不仅仅是芯片本身强,基于芯片构建的系统一样强。可能很多人在近两年才频繁听到华为讲自己的芯片。殊不知,为了这一天华为已经默默研发了十几年,2004年,华为就开始投资研发第一颗嵌入式处理芯片,目前投入超过2万名工程师。
原则上顺应大势,再加上好的产品,生态构建只是时间问题。但华为明显不想把这一进程拉的太长,所以有了一系列的重大举措。
开放鲲鹏主板接口规范和设备管理规范,提供整机参考设计指南,全面向伙伴开放华为的技术积累和实践经验。合作伙伴可以基于鲲鹏主板和整机参考设计指南,快速开发出自有品牌的服务器和台式机产品。
开源服务器操作系统,开源版本的名称为openEuler,支持合作伙伴发行基于openEuler的商业版,支持各行业主流应用和软件迁移到基于openEuler的操作系统上。
开源GaussDB OLTP单机版数据库,开源版本的名称为openGauss,并将于2020年6月全面上线,可覆盖企业70%以上的数据库业务场景,支持合作伙伴发展自己品牌的数据库产品和应用。
这等于是将市场空间让渡给合作伙伴,华为的态度已经非常清晰,缺什么华为先做着,大家先用着,先建立起一个完整的生态体系,然后再不断丰富完善。
更关键的是华为不仅开放开源软硬件产品,还有承诺。华为明确表示,条件成熟时,可以停止TaiShan服务器的销售。也就是说华为会不断使能合作伙伴,推动生态成熟。
具体来说,下一步华为将从四个方面努力:
以行业聚合应用:围绕各个行业,联合行业伙伴打造完整的产业生态链和具有竞争力的解决方案。
以区域整合产业:一枝独秀不是春,百花开放春满园。华为聚焦处理器和部件的开发,鲲鹏产业是业界共享的,欢迎各区域的伙伴根据自身特点打造本区域的鲲鹏产业。
以联盟孵化标准:联合绿色计算产业联盟、边缘计算产业联盟等组织,制定开放的软硬件标准体系,促进产业的健康发展。
以社区发展开发者:开发者是产业的灵魂,未来5年,我们将联合各社区和高校培养500万开发者,为计算产业注入活力。
未来五年,华为计划投入15亿美金用于发展产业生态。
因此,回到华为究竟能不能成功这个问题上,最重要就看生态建设的推进速度了。
总结全文,应该说这是华为又一次的重大战略转向,毕竟定位芯片提供商和解决方案提供商的核心工作是不同的。可以预见的是,这项事业的推进还需更多动力,随着全新计算战略的不断推进,华为还会也必须做更多的调整和取舍。但同样必须说的是,华为一定会成功,无关民族情怀,因为它有这样的底蕴,以及足够的沉淀和积累。